desenvolvimento e operação de programas de ensaio de ... · caracteriza a faixa de valores,...

Desenvolvimento e operação de programas de ensaio de proficiência

Gilberto Batista de Souza

Embrapa Pecuária Sudeste

[email protected]

OUTUBRO / 2010

XV Encontro Nacional sobre Metodologias e Gestão de Laboratórios da EMBRAPA – XV MET

Embrapa Clima Temperado – PELOTAS - RS

ESCOPO DO CURSO

CONCEITOS DE METROLOGIA QUIMICA

CONCEITOS DE TERMOS ESTATISTICOS

ESTATÍSTICA APLICADA NO TRATAMENTO DE DADOS

TESTES DE SIGNIFICÂNCIA

TESTES ESTATISTICOS PARA DETECÃO DE OUTLIERS

PROTOCOLO INTERNACIONAL HARMONIZADO PARA ENSAIO DE

PROFICIÊNCIA EM LABORATÓRIOS ANALÍTICOS (QUÍMICOS)

Conceitos básicos de metrologia

Incerteza das medições: Parâmetro, associado ao resultado de umaMEDIÇÃO, que caracteriza a dispersão dos valores que podem serfundamentadamente atribuídos a um mensurando (VIM, 2007).

Caracteriza a faixa de valores, dentro da qual o valor real deve se situar,com um nível de confiança especificado.

Incerteza da medição não implica em dúvida quanto a validade de umamedição; ao contrário, o conhecimento da incerteza implica numa maiorconfiança na validade do resultado de uma medição.

Possíveis fontes de Incerteza

Má definição do mensurando; Amostragem não-representativa;

Erro pessoal na leitura de instrumentos analógicos; Resolução do instrumento;

Valores inexatos dos padrões de medição e materiais de referência;

Ajuste de curva; interpolação; etc

Valor verdadeiro: valor atribuído a uma grandeza específica e aceito, àsvezes por convenção, como tendo uma incerteza apropriada para umadada finalidade (EURACHEM/CITAC, 1998).

O valor verdadeiro convencional pode ser denominado como:

valor designado,

melhor estimativa do valor,

valor convencional ou valor de referência.

Frequentemente um grande número de resultados das medições de umagrandeza é utilizado para estabelecer um valor verdadeiro convencional.

Precisão: está relacionada com a concordância das medidas entre si, ou seja, quanto maior a dispersão dos valores menor a precisão (relacionada com a repetitividade e com a reprodutibilidade).

Quanto menor a dispersão dos valores maior a precisão

Quanto menor a amplitude maior a precisão

3

4

5

6

7

1 2 3 4 5 6 7 8 9 10

É um tipo de precisão referente a medições feitas sob condições de repetitividade,

isto é:

mesmo método;

mesmo material;

mesmo operador;

mesmo laboratório;

repetições em curto período de tempo.

Repetitividade (r)

É calculada a partir do desvio padrão dos resultados dos ensaios sob condição

de repetitividade - recomenda-se 7 ou mais repetições para o cálculo do desvio

padrão para cada concentração.

É aconselhável calcular o limite de repetitividade “r” que capacita o analista a

decidir se a diferença entre análises duplicatas de uma amostra, determinada sob

condições de repetitividade, é significante.

O limite de repetitividade (r) para um nível de significância de 95% e 6 graus

de liberdade (N = n-1), é dado por:

sr = desvio padrão de repetitividade. rsr 8,2

Repetitividade (r)

É um conceito de precisão referente a medições feitas sob condições de

reprodutibilidade, isto é:

mesmo método;

operadores diferentes;

laboratórios diferentes;

equipamentos diferentes;

longo período de tempo.

Reprodutibilidade (R)

Embora a reprodutibilidade não seja um componente de validação de método

executado por um único laboratório, é considerada importante quando um

laboratório busca a verificação do desempenho dos seus métodos em relação aos

dados de validação obtidos por meio de comparação interlaboratorial.

Reprodutibilidade (R)

A partir do desvio padrão obtido sob condições de reprodutibilidade é possível

calcular o limite de reprodutibilidade “R”, o qual permite ao analista decidir se a

diferença entre os valores da duplicata das amostras analisadas sob condições de

reprodutibilidade é significante.

O limite de repetitividade (r) para um nível de significância de 95%, é dado por:

28,2 RSR 2RS = variância de reprodutibilidade associada aos resultados considerados, para

cada laboratório.

O cálculo da reprodutibilidade é efetuado para cada nível, separadamente, após eliminação dos valores dispersos.

Labs A B C D E F Média s s21 0,27 0,28 0,28 0,27 0,28 0,28 0,2767 0,0052 0,00002672 0,301 0,3 0,302 0,304 0,304 0,301 0,3020 0,0017 0,00000283 0,285 0,288 0,295 0,282 0,29 0,288 0,2880 0,0044 0,00001964 0,292 0,279 0,287 0,316 0,281 0,291 0,2910 0,0133 0,00017725 0,276 0,27 0,281 0,27 0,28 0,277 0,2757 0,0048 0,00002276 0,282 0,284 0,285 0,287 0,286 0,285 0,2848 0,0017 0,00000307 0,277 0,279 0,28 0,273 0,278 0,28 0,2778 0,0026 0,00000708 0,246 0,256 0,249 0,241 0,245 0,243 0,2467 0,0053 0,00002839 0,28 0,278 0,284 0,281 0,275 0,277 0,2792 0,0032 0,000010210 0,3 0,307 0,311 0,309 0,307 0,306 0,3067 0,0037 0,000013911 0,301 0,29 0,284 0,308 0,293 0,284 0,2933 0,0096 0,000091912 0,272 0,277 0,269 0,27 0,278 0,27 0,2727 0,0039 0,0000151

Somatória 0,0004181

Anova: fator único

RESUMOLab Contagem Soma Média Variância

1 6 1,66 0,2766667 0,00002672 6 1,812 0,302 0,00000283 6 1,728 0,288 0,00001965 6 1,654 0,2756667 0,00002276 6 1,709 0,2848333 0,00000307 6 1,667 0,2778333 0,00000708 6 1,48 0,2466667 0,00002839 6 1,675 0,2791667 0,000010210 6 1,84 0,3066667 0,000013912 6 1,636 0,2726667 0,0000151

ANOVAFonte da variação SQ gl MQ F valor-P F críticoEntre grupos 0,014834 9 0,0016482 110,59283 7,56E-30 2,073351Dentro dos grupos 0,000745 50 0,0000149

Total 0,015579 59

Ex. para calcular r e R

00027218,06

0000149,0001648,02

entres

011,0 0,00001498,2 r

047,000027218,00000149,08,2 R

Q1: Um laboratório obtém 2 replicatas: 0,273 e 0,279%; a diferença de 0,006%entre as duas replicatas é aceitável, pois r = 0,011, portanto os dois resultadossão válidos.

Q2: Um laboratório obtém e replicatas : 0,269 e 0,299%; a diferença de 0,017%entre as duas replicatas é inaceitável (r = 0,011); um dos valores deve serrejeitado.

Q3: Dois labs.: um obtém 0,269% e o outro 0,299%; a diferença de 0,030% entreos dois resultados é menor que o valor de R = 0,047; portanto os dois valoressão aceitos.

Exatidão: Grau de concordância entre o resultado de uma medição e umvalor verdadeiro do mensurando (VIM, 2007).

Está relacionada com o seu erro absoluto, isto é, com a proximidade do valormedido em relação ao valor verdadeiro da grandeza.

Avaliada por meio da comparação entre o valor medido e o valor certificadode um CRM.

Comparando com resultados obtidos por intermédio da utilização de ummétodo já existente e de exatidão conhecida.

Comparando os resultados obtidos por intermédio da adição padrão à umamatriz.

EXATIDÃO E TENDÊNCIA (bias)

Exatidão do método é definida como sendo a concordância entre o resultado deum ensaio e o valor de referência aceito como convencionalmente verdadeiro.

Os processos normalmente utilizados para avaliar a exatidão de um método são,entre outros: uso de materiais de referência, participação em comparaçõesinterlaboratoriais e realização de ensaios de recuperação.

A exatidão, quando aplicada a uma série de resultados de ensaio, implica numacombinação de componentes de erros aleatórios e sistemáticos.

Estudante Resultado (mL) Comentário

A 10,08 Preciso e inexato 10,11 10,09 10,10 10,12

B 9,88 Exato e impreciso 10,14 10,02 9,80 10,21

C 10,19 Impreciso e inexato 9,79 9,69 10,05 9,78

D 10,04 Preciso e exato 9,98 10,02 9,97 10,04


A tendência é algumas vezes chamada de recuperação de um método analítico,é o erro sistemático desse sistema de medição.

Além da avaliação da tendência, é importante estimar a incerteza de medidaassociada à tendência e incluir este componente na estimativa global da incertezade medição.

A tendência de um método analítico é geralmente determinada pelo estudo demateriais de referência ou por adição padrão (fortificação).

A tendência pode ser expressa como uma recuperação analítica:

100(%)Re

3

21

CCCcuperação

Recuperação: É a fração do analito adicionado na amostra teste (fortificada)previamente a análise. Geralmente é realizada com no mínimo 6 repetições dobranco da matriz ou amostra não fortificada e amostra fortificada com o analito adiferentes concentrações.

C1 = concentração determinada na amostra fortificada;

C2 = concentração determinada na amostra não fortificada e

C3 = concentração adicionada.

Na avaliação da exatidão utilizando um material de referência certificado (MRC):os valores obtidos pelo laboratório, média e o desvio padrão de uma série deensaios em replicatas, devem ser comparados com os valores certificados domaterial de referência.

Para esta comparação podem ser utilizados diversos critérios de decisão, entre osquais: erro relativo; teste de hipóteses; índice z, e erro normalizado.


Erro relativo (ER): 100

verdadeiro

verdadeiromedido

XXXER ; medidoX = média do

valor medido experimentalmente e verdadeiroX = valor aceito como verdadeiro

(valor certificado do MRC).

Erro relativo (ER):

Teste de hipóteses: teste F para verificar se as variâncias das amostras

podem ser consideradas iguais, seguido do teste t de Student (ver INMETRO:

DOQ-CGCRE-008 – Revisão 02 – JUNHO/2007).

Teste de hipóteses

Índice z: o índice z é também um modo de avaliar o desempenho do laboratório,

utilizando MRC:

sXXz verdadeiromedido ; medidoX = média do valor medido

experimentalmente; verdadeiroX = valor aceito como verdadeiro (valor certificado do MRC) e s = desvio padrão (incerteza) do MRC.

A avaliação segue o seguinte critério: se 2z o resultado é satisfatório;

32 z o resultados é questionável e 3z o resultados é insatisfatório.

Erro normalizado En: Caso o laboratório calcule a incerteza do seu resultado ( labU ), o valor verdadeiro ( VerdadeiroX ) deve estar dentro do intervalo labX ± incerteza expandida.

22

.

reflab

verdlabn

UUXXE

1nE o resultado pode ser considerado adequado


Linearidade

Para métodos quantitativos é determinada pela medição de amostras com

concentrações de analito abrangendo a faixa reivindicada do método.

Linearidade é a habilidade de um método analítico em produzir resultados que sejam

diretamente proporcionais à concentração do analito em amostras, em uma dada faixa

de concentração.

Os resultados são usados para obter uma reta por regressão com relação ao cálculo

de analito, usando-se o método dos mínimos quadrados.

É conveniente que um método seja linear ao longo de uma faixa específica, mas este

não é um requisito absoluto. Quando a linearidade for inatingível para um

procedimento específico, deve ser determinado um algoritmo adequado para

cálculos.

A equação da reta que relaciona as duas variáveis é:

y = resposta medida ou sinal analítico (absorbância, altura ou área do pico, etc.);

x = concentração;

a = interseção com o eixo y, quando x = 0;

b = inclinação da curva analítica = sensibilidade (S).

O método é mais sensível quando pequenas variações de concentração

resultam em maior variação na resposta, ou seja, maior inclinação (b).

Em geral, serão necessários vários níveis de concentração, no mínimo cinco, para

construir a curva analítica. O número de replicatas em cada nível de concentração

deve ser o mais próximo possível daquele empregado na rotina do laboratório.

Linearidade

Linearidade

PERGUNTAS:

1) É linear o gráfico de calibração? Se for uma curva, qual a forma?

2) Sabendo-se que um dos pontos da reta de calibração está sujeito a erros, qual é a

melhor reta que passa pelos pontos?

3) Supondo que a calibração é realmente linear, quais são os erros estimados e o

limites de confiança para a inclinação e interseção na origem da reta?

4) Quando o gráfico de calibração é utilizado para análises de amostras, quais são

os erros e os limites de confiança para a concentração determinada?

5) Qual o limite de detecção do método? Isto é, qual a menor concentração do

analito que se pode detectar com um nível de confiança predeterminado?

A linearidade de um método pode ser observada pelo gráfico dos resultados dos

ensaios em função da concentração do analito e verificada a partir da equação da

regressão linear, determinada pelo método dos mínimos quadrados. Para tal, deve

ser verificada a ausência de valores discrepantes para cada nível de concentração e

a homocedasticidade dos dados, antes de fazer a regressão linear.

Linearidade

A verificação da ausência de valores discrepantes pode ser feita pelo teste de

Grubbs

A homocedasticidade, isto é, homogeneidade da variância dos resíduos pelo

teste de Cochran.

s

xxG i

p

ii

máx

s

sC

1

2

2

Grubbs Cochran

TABELA VALOR CRÍTICO TESTE DE COCHRAN (95%)p n=2 n=3 n=4 n=52 - 0,975 0,939 0,9063 0,967 0,871 0,798 0,7464 0,906 0,768 0,684 0,6265 0,841 0,684 0,598 0,5446 0,781 0,616 0,532 0,487 0,727 0,561 0,48 0,4318 0,68 0,516 0,438 0,3919 0,638 0,478 0,403 0,35810 0,602 0,445 0,373 0,33111 0,57 0,417 0,348 0,30812 0,541 0,392 0,326 0,28813 0,515 0,371 0,307 0,27114 0,492 0,352 0,291 0,25515 0,471 0,335 0,276 0,24216 0,452 0,319 0,262 0,2317 0,434 0,305 0,25 0,21918 0,418 0,293 0,24 0,20919 0,403 0,281 0,23 0,220 0,389 0,27 0,22 0,192

TABELA TESTE DE COCHRANTABELA TESTE DE GRUBBS

N Critical Z N Critical Z3 1.15 27 2.864 1.48 28 2.885 1.71 29 2.896 1.89 30 2.917 2.02 31 2.928 2.13 32 2.949 2.21 33 2.95

10 2.29 34 2.9711 2.34 35 2.9812 2.41 36 2.9913 2.46 37 3.0014 2.51 38 3.0115 2.55 39 3.0316 2.59 40 3.0417 2.62 50 3.1318 2.65 60 3.2019 2.68 70 3.2620 2.71 80 3.3121 2.73 90 3.3522 2.76 100 3.3823 2.78 110 3.4224 2.80 120 3.4425 2.82 130 3.4726 2.84 140 3.49

Calcular o modelo através da regressão linear, os resíduos e o coeficiente de

correlação linear (r).

O coeficiente de correlação linear (r) é freqüentemente usado para indicar o quanto

pode ser considerada adequada a reta como modelo matemático.

Um valor maior que 0,90 é, usualmente, requerido (coeficientes de correlação r e

determinação R2).

Linearidade

Coeficiente de correlação (r):

Coeficiente que indica a força da associação entre quaisquer duas variáveis

métricas. O sinal (+ ou -) indica a direção da relação.

O valor pode variar de -1 a +1, em que +1 indica uma perfeita relação positiva, 0

(zero) indica relação nenhuma e -1 uma perfeita relação negativa ou reversa

(quando uma variável se torna maior a outra fica menor).

Coeficiente de determinação (R2):

Medida da proporção da variância da variável dependente em torno de sua media

que é explicada pelas variáveis independentes.

O coeficiente pode variar entre 0 e 1. Se o modelo de regressão é propriamente

aplicado e estimado, pode-se assumir que quanto maior o valor de R2, maior o poder

de explicação da equação de regressão e, portanto, melhor a previsão da variável

dependente.

Linearidade

ErrosQualquer resultado de uma medida experimental está associada a um erro, ouseja, a uma incerteza.Esta incerteza é considerada a diferença entre o valor medido e o valor verdadeiro.

Os erros podem ser classificados em três categorias:

grosseiros, aleatórios (randômicos) ou indeterminados e sistemáticos oudeterminados.

Erros grosseiros são facilmente reconhecidos. Eles são erros tão sérios quenão deixam alternativas a não ser refazer todo o experimento.

Exemplos incluem a quebra do equipamento, contaminação de reagentes,erros na adição de alíquotas, etc.

Enganos na leitura de uma escala

Erro de cálculos nas operações

Erros na adição de alíquotas

Ocorrem em geral pela falta de cuidado ou inabilidade de fazer uma determinada análise

Erros Aleatórios:

Não possuem valor definido, é resultante de uma medição menos a média de umnúmero infinito de medições sob condições de repetitividade e flutuam de maneiraaleatória (são bidirecionais).

XxrioErroAleató i

• São irregulares e resultam em variabilidade afetando o desvio padrão.

• Não tem causas assimiláveis,

• Podem ser submetidos a tratamento estatístico para permitir saber qual o valor

mais provável e também a precisão de uma série de medidas.

Estimativa do valor mais provável

Precisão de uma série de medidas.

Submetidos a tratamento estatístico

PERMITIR

ERROS ALEATÓRIOS

ERRO ALEATÓRIO

PRECISÃO3

4

5

6

7

1 2 3 4 5 6 7 8 9 10

Erros Sistemáticos

São inúmeros e foram agregados em quatro grupos:

São unilaterais resultando um desvio constante nos resultados, tem causasassimiláveis e estão relacionados com a exatidão, sendo geralmentecaracterizados por conservarem o mesmo valor em medições sucessivas.

CLASSIFICAÇÃO

Erros de métodos Erros operacionais Erros pessoais Erros instrumentais

Afetam a grandeza do resultado

Afetam a média de um conjunto de resultados

Afetam a exatidão

São erros que resultam de causas constantes que alteram de modo uniforme os resultados das medidas

ERRO SISTEMÁTICO EXATIDÃO

3

4

5

6

7

1 2 3 4 5 6 7 8 9 10

São erros que resultam de causas constantes que alteram de modo uniforme os resultados das medidas

ixErro 100%

ixErro

Cálculos dos erros:

Os erros podem ser analisados de forma rápida, através das seguintes equações:

= valor verdadeiro, p.e. resultado de um material de referência;

xi = resultado de uma medida experimental.

CONCEITO DE TERMOS ESTATÍSTICOS

Elemento: a unidade considerada para um estudo estatístico édenominada de elemento. Exemplo: um objeto; um individuo, uma peça.

População: conjunto de elementos que tem pelo menos uma característicaem comum. Esta característica deve delimitar corretamente quais são oselementos da população que podem ser animados ou inanimados.Exemplos: um lote de peças; um lote de um polímero; população do estadode São Paulo.

Amostra: subconjunto de elementos de uma população. Este subconjuntodeve ter dimensão menor que o da população e seus elementos devem serrepresentativos da população.

Graus de liberdade (N):

é um conceito ligado ao número de dados disponíveis (livres) para ocálculo da estatística. Por exemplo, ao estimarmos a média populacional() com a média amostral ( ) perdemos um grau de liberdade, assim aestatística t-student terá n-1 graus de liberdade.

x

Distribuição normal:Uma variável quantitativa segue uma distribuição normal, se sua distribuiçãode freqüências tem o formato similar ao de um sino (curva de Gauss), ouseja, a maioria dos valores se concentra em torno da média e, a medida quese afasta do centro as observações são cada vez mais raras. Essadistribuição é considerada simétrica. Muitas variáveis têm essa distribuição,tais como altura das pessoas adultas do sexo masculino, coeficiente deinteligência, etc.

Distribuição normal

Histograma:

É um gráfico de colunas justapostas que representa uma distribuição de freqüênciapara dados contínuos ou uma variável discreta quando esta apresentar muitosvalores distintos. No eixo horizontal são dispostos os limites das classes segundoas quais os dados foram agrupados enquanto que o eixo vertical corresponde àsfreqüências absolutas ou relativas das mesmas.

87 88 89 90 91 92 93 94 95 960

10

20

30

40

Freq

uenc

ia (%

)

MS (%)

M 92,20Med 92,24Mo 92,20

Medidas de assimetria:

A medida de assimetria é um indicador da forma da distribuição dos dados.

Ao construir uma distribuição de freqüências e/ou um histograma, está-sebuscando, também, identificar visualmente, a forma da distribuição dos dadosque é ou não confirmada pelo coeficiente de assimetria de Pearson (As) definidocomo:

MoAS

para dados populacionais para dados amostrais

sMoXAS

Simétrica: média = mediana = moda ou As = 0

assimétrica negativa: média ≤ mediana ≤ moda ou As < 0

O lado mais longo do polígono de freqüência (cauda dadistribuição) está à esquerda do centro.

O lado mais longo do polígono de freqüência está à direita do centro.

assimétrica positiva : moda ≤ mediana ≤ média ou As > 0

Etapas para construção de tabelas de freqüências e histogramas:

- Coletar n amostras entre 30 < n < 200.

- Calcular a amplitude:

- Encontrar o valor máximo (Vmax) e mínimo (Vmin) dos dados em estudo.

minmax VVR

- Determinar o numero de classes de freqüência: nk

- Calcular a amplitude dos intervalos das classes:kRh

outra forma de calcular é dividir por 1, 2 ou 5 de forma a obter-se de 5 a20 intervalos de classes, de igual amplitude.

- Definir o limite superior e inferior de cada classe e seu ponto médio.- Construir uma tabela de freqüência.- Traçar o diagrama.

Exemplo: Foi realizado um levantamento de três meses dos resultados dasanálises de proteína (%) em amostra de farelo de trigo. Com os dados,construir um histograma para as análises.

16,4 16,4 15,8 17,7 17,6 17,7 17,3 16,7 17,4 16,8

16,9 17,0 16,9 16,9 16,5 16,7 16,6 16,6 16,6 16,4

16,7 16,6 16,8 16,0 16,9 16,8 17,4 17,0 16,9 16,4

16,5 16,9 16,6 16,6 16,7 16,8 16,6 16,5 17,0 17,0

16,8 16,8 16,8 16,6 17,0 16,9 17,1 16,4 16,8 16,7

17,1 16,7 17,0 16,7 16,2 16,8 17,2 17,5 16,7 16,9

17,0 16,6 16,8 17,2 17,0 17,0 16,8 16,9 16,4 16,6

16,6 16,9 16,8 17,1 16,6 16,9 16,8 17,0 16,0 16,6

- Tamanho da amostra: 80n

minmax VVR 9,18,157,17 R- Amplitude:

nk 80k 94,8k- Classes de freqüência:

kRh 2,00,212

94,89,1

h- Amplitude das classes:

- Tabela de freqüência:

Limites das classes Código da classe

Freqüência (contagem)

Freqüência (%)

15,8 ≤ x < 16,0 A 1 1,25

16,0 ≤ x < 16,2 B 2 2,5

16,2 ≤ x < 16,4 C 1 1,25

16,4 ≤ x < 16,6 D 9 11,25

16,6 ≤ x < 16,8 E 21 26,25

16,8 ≤ x < 17,0 F 24 30

17,0 ≤ x < 17,2 G 13 16,25

17,2 ≤ x < 17,4 H 5 6,25

17,4 ≤ x < 17,6 I 2 2,5

17,6 ≤ x < 17,7 J 2 2,5

Total (n) 80- Histograma:

0

5

10

15

20

25

30

35

A B C D E F G H I J

Código da Classe

Freq

uênc

ia (%

)

Estatística Aplicada no Tratamento e Avaliação de Dados:

Uma vez que as medidas reais contêm erros experimentais, é praticamenteimpossível estar completamente certo de um resultado.

O erro aleatório pode ser determinado e desta forma, todos os resultadosanalíticos devem estar associados a uma incerteza, ou intervalo de confiança.

A estimativa da incerteza pode se basear no nível de qualidade da leitura deuma medida num dado equipamento, ou na experiência do analista com umdeterminado método.

Sempre que possível, a incerteza deve ser expressa como um desvio padrãode uma série de medidas em replicatas.

Sempre que possível a qualidade, das medidas experimentais, deve serverificada para avaliar a confiabilidade dos resultados analíticos.

Media ( ): a média aritmética, que é normalmente abreviada para média,é a soma de todos os valores obtidos dividida pelo número de medidas (n):

;x

Média amostral:

n

xx

n

ii

1

Média populacional:N

xN

ii

1

Mediana (Med): a mediana é o valor central de um conjunto de dadosarranjados em ordem crescente ou decrescente, ou seja, é o valor de talmagnitude que, o número de dados menores do que ele é igual ao númerode dados maiores do que ele.

Replicatas Valor Replicatas Valorx1 5,2 x10 4,7x2 4,8 x6 4,7x3 5,1 x2 4,8x4 4,9 x8 4,8x5 5,2 x4 4,9x6 4,7 x3 5,1x7 5,2 x1 5,2x8 4,8 x5 5,2x9 5,3 x7 5,2x10 4,7 x9 5,3

Média 4,99Mediana 5,00





• Quando a quantidade de dados (n) é impar, a mediana é o valor que ocupaa posição central;

• Quando a quantidade de dados (n) é par, há duas posições centrais na listaordenada; assim, a mediana da amostra é a média aritmética dos doisvalores que ocupam as posições ventrais.

Moda (Mo): é o valor amostral que tem a maior freqüência, ou seja, é oencontrado em maior número de vezes, portanto, é a observação mais"provável" da distribuição dos dados.Portanto, numa amostra a moda pode não existir. Uma distribuição em que nãohá elementos repetidos é dita amodal.

Também se considera que a moda pode não ser única. Se dois valoresaparecem em igual quantidade de vezes a distribuição é dita bimodal. Para trêsvalores, trimodal, e assim, sucessivamente.

Importante é notar que se existe apenas uma moda em uma amostra, há apenasum grupo de indivíduos com suas variações, ou seja, a amostra é homogênea.

Mas, se houver duas ou mais modas, há grupos diferentes dentro daquelaamostra. Diz-se, então, que a amostra é heterogênea.

Exemplo: Os valores de medidas de uma amostra foram os seguintes: 3, 3, 4,5, 5, 6, 6, 6, 7, 8, 9, 9; calcular a Moda dos resultados obtidos:Resposta: a moda é o valor 6, porque corresponde ao valor com maior

freqüência, é o valor que mais ocorre.

Desvio: a diferença entre qualquer resultado de uma análise ( ) e a média dasérie de resultados é denominado de desvio da média (d). O desvio é positivo seo valor é maior do que a média, ou negativo se for menor do que a média:

ix

xxd i

1n

Variância: é definida como sendo a soma dos quadrados dos desvios emrelação à média, dividida pelo número de observações da amostra menos um.

Para não trabalhar com valores negativos obtidos na diferença, trabalha-se comvalores absolutos ou eleva-se ao quadrado. Sendo mais fácil, elevar aoquadrado e tirar a média, o valor resultante é simbolizado por e chama-sevariância amostral:

2s

1

1

2

2

n

Xxs

n

ii

Desvio Padrão Experimental ( ): a definição mais útil para a dispersão dosdados experimentais é o desvio padrão, é utilizado freqüentemente para avaliara precisão dos resultados em um conjunto de dados realizados em replicatas. Aestimativa do desvio padrão é calculado extraindo-se a raiz quadrada doquociente obtido dividindo a soma dos quadrados dos desvios ( ) individuaispelo número de determinações menos uma unidade:

s

d

11

2

n

xxs

n

ii

Coeficiente de variação: é frequentemente utilizado o conceito de coeficientede variação (cv%), também conhecido como desvio padrão relativo (DPR). Asunidades são, expressas em porcentagem e são exemplos de erros relativos,isto é, um erro estimado dividido por uma estimativa do valor absoluto daquantidade medida. Erros relativos são frequentemente usados na comparaçãoda precisão de resultados que têm diferentes unidades ou magnitudes, e sãotambém importantes no estudo da propagação de erros.

xscv

100%

São exemplos de erros relativos

Erros relativos são frequentemente usados na comparação daprecisão de resultados que têm diferentes unidades ou magnitudes

São também importantes no estudo da propagação de erros.

s DISPERSÃO PRECISÃO CV

Coeficiente de variação (CV):

Taverniers, I. ; De Loose, M.; van Bockstaele, E. Trends in quality in the analytical laboratory. II. Analyticalmethod validation and quality assurance. Trends in Analytical Chemistry, Vol. 23, No. 8, 2004

cv(%) X Concentração

Exemplo: considere os valores da porcentagem de proteína em uma ração,obtido por um analista:

% PB

31,62 31,76 31,60

31,47 31,71 31,60

31,64 31,53 31,71

Podemos observar através da tabela que: o valor de 31,62 é a mediana umavez que há quatro valores menores e quatro valores maiores do que o valor31,62.

E ao aplicarmos as fórmulas para a média e para o desvio padrão, obtêm-seos seguintes valores, sendo que os resultados podem ser expressosassociados ao erro: 31,63 ± 0,09.

Mediana Desvio Padrão (s)

Coeficiente de variação

(cv%)

31,62 31,63 0,09 0,28

x

Intervalo de confiança: Geralmente somente é realizado um pequeno númerode determinações em duplicatas, triplicatas, etc., tornando-se necessárioexaminar como estes dados podem ser interpretados de uma maneira lógica.

Uma análise mais detalhada mostra que, sejam quais forem os valores de ede , aproximadamente 68% da população situa-se entre ±1 da média,aproximadamente 95% está entre ±2 e que aproximadamente 99,7% situa-seentre ±3 da média.

O Intervalo de Confiança e os valores extremos deste limite sãoconhecidos como Limites de Confiança.

O termo “confiança” implica que podemos assegurar com certo grau deconfiança, e com certa probabilidade, que o Intervalo de Confiança incluio valor real.

O tamanho do intervalo de confiança depende de quanto nós queremosque ele inclua o valor real.

Quanto maior a certeza, maior o intervalo requerido.

O desvio padrão pode ser utilizado paracalcular os limites dentro do qual o valorverdadeiro se situa a um dado nível deprobabilidade.

Para verificar a probabilidade de o valorexperimental estar próximo do valor real,utiliza-se o teste estatístico denominado de“t “ de Student.

Mesmo a partir de um número limitado demedidas é possível encontrar a médiaverdadeira.

É preciso calcular a média experimental, , e o desvio padrão, .

xs

O Intervalo de Confiança é uma expressão que estabelece que a médiaverdadeira, , se situa dentro de certa distância da média experimental,sendo expresso pela fórmula:

Ntsx

EXEMPLO: Utilizando os dados do exemplo anterior, onde (n=9), podemosdeterminar o Intervalo de Confiança para um nível de probabilidade de 95%empregando a equação para o teste “t “:

63,31x

09,0s0

007,063,319

09,0306,263,31

A porcentagem de proteína encontrada pode ser expressa por: 31,63 ± 0,07%.

Isto significa que a probabilidade do valor real se situar no intervalo de 31,56% a31,70% é de 95%.

É evidente que se aumentarmos o nível de confiança para 99% o intervalo deconfiança se estenderá.

Exemplo: O conteúdo de íons sódio de uma espécie de urina foi determinadousando um fotômetro de chama. Os seguintes valores foram obtidos: 102, 97, 99,98, 101, 106 mg L-1. Quais são os limites de confiança para 95% e 99% deconfiança para a concentração dos íons sódio.

nstx - o limite de confiança para 95% é dado por: 627,357,25,100

= 100,5 ± 5,4 mg L-1

- Similarmente, para 99% de limite de confiança: 627,303,45,100

= 100,5 ± 5,4 mg L-1

x = 100,5 mg L-1 S = 3,27 mg L-1 56 Nn

99% (P = 0,01) tCRÍTICO = 4,03

Limite de Confiança 95% (P = 0,05) tCRÍTICO = 2,57

Exemplo: Dez amostras são retiradas de um lote de calcário e analisadas.

O teor de Cálcio apresentou uma = 4,30% (m/m) e um desvio-padrãoestimado, = 0,30% (m/m). Qual é o intervalo de confiança, no nível de 95%,da média do lote?

xs

n = 10; t95 = 2,262; x = 4,30%; s = 0,30%

nstx 10

30,0262,230,4

%21,0%30,4

Exemplo: Um químico para avaliar o método de quantificação para cobre,preparou uma solução conhecida de Cu de 50 mg L-1. Esta solução foianalisada seis vezes por absorção atômica, tomando para cada determinaçãoalíquotas de 10 mL. Foram encontrados os seguintes resultados: 48,2; 51,0;46,6; 51,5; 43,8; 46,9 mg L-1.

Calcular a média, mediana, desvio das medidas, desvio padrão, coeficientede variação e o intervalo de confiança?

Valores (mg L-1) 43,8 46,6 46,9 48,2 51,0 51,5

Freqüência 1 1 1 1 1 1

Média: Lmgnx

x i /486

288

Mediana Neste caso a mediana corresponde ao valor do meio entre:

46,9 e 48,2 = 47,5

Desvios das medidas

Determinação Desvio em relação à média Desvio ao quadrado

xx xx 2xx

43,8 - 48 -4,2 17,64

46,6 - 48 -1,4 1,96

46,9 - 48 -1,1 1,21

48,2 - 48 0,2 0,04

51,0 - 48 3,0 9,00

51,5 - 48 3,5 12,25

Total 0 xxi 10,422 xxi

Desvio Padrão Lmg

nxx

s i /902,242,81

2

Coeficiente de Variação: %04,648

100902,2100

xSCV

nstx 6902,2571,248

05,348

Intervalo de Confiança no nível de 95%:

Umas das propriedades mais importantes de um método analítico é que eledeve ser isento de erros sistemáticos, isto é, o valor calculado pelo métododeve ser o valor real.

Entretanto, erros aleatórios fazem com que o valor medido raramente sejaexatamente igual ao valor real.

Para decidir se a diferença entre o valor medido e o valor padrão pode seratribuído a estes erros aleatórios, um teste estatístico, conhecido como teste designificância, pode ser empregado.

TESTES DE SIGNIFICÂNCIA

Testes estatístico para decidir se existe diferença significativaentre o valor medido e o valor padrão.

Ferramentas importantes para validação de resultados

Verificar se um resultado individual, no conjunto de resultados, pode ser considerado discrepante (Outlier)

Verificar se existe diferença estatisticamente significativa entre a Média de valores experimentais com um valor considerado verdadeiro

Se há ou não diferenças estatisticamente significativas, na precisão dos resultados de dois conjuntos de valores

Se um valor médio de um conjunto de resultados é significativamente diferente de um outro valor médio obtido

Valor probabilistico do limite de rejeição da Hipótese nula (H0), do erroTipo I. Em geral adota-se o valor alfa de 0,05 ou 0,01, admitindo-se, aorejeitar a H0, a probabilidade de ocorrência de 1 erro em 20 (5%) ou 1 em100 (1%), respectivamente.

Hipótese nula (H0): é a hipótese que se testa considerando-se não haver diferenças entre grupos específicos objetos de estudo.

Hipótese alternativa (H1): é a hipótese que contraria a de nulidade, no sentido de afirmar que há diferença entre grupos específicos objetos da pesquisa

TIPO 1: consiste em aceitar, como diferentes, médias de tratamentos que na verdade são iguais

TIPO 2: consiste em aceitar, como iguais, médias de tratamentos que na verdade são diferentes

ERRO

Teste mono-caudal (unilateral)

Teste estatístico no qual a H1 especifica a direção da diferença as serdetectada, assim representado: 1 0 ou 1 0

Teste bi-caudal (bi-lateral)

Teste estatístico no qual a H1 (hipótese alternativa) não especifica adireção da diferença as ser detectada, como está representado: 1 0

podendo 1 ser maior ou menor a 0.

Critério estatístico empregando o Teste “t” : este é um teste designificância para verificar se a média de um conjunto de dados se diferedo valor verdadeiro (valor referência).

Teste t (Student)

Comparação entre uma média experimental e um valor conhecido:

Exemplo: Em um método para determinar ferro por absorção atômica osseguintes valores foram encontrados para um material de referência contendo38,9% de ferro: 38,9; 37,4 e 37,1%. Há alguma evidência de erro sistemático?

nstX .

)23%9,38%964,0

%8,37

Nn

sx

98,1964,039,388,37

t

t

snxt

Para 2 graus de liberdade, o valor crítico de t é 4,3 (p=0,05).

No exemplo o valor t é menor, a hipótese nula é mantida, não háevidência de erro sistemático.

NÚMERO DE DETERMINAÇÕES

GRAUS DE LIBERDADE

NÍVEL DE CONFIANÇA

N N - 1

Comparação das médias de duas amostras.

Verificar se existe diferença significativa entre a média experimental de umanova metodologia e a média experimental de uma metodologia referência

Exemplo: Numa comparação entre dois métodos para a determinação de boro em amostras de plantas, os seguintes resultados foram obtidos em µg/mL:

Método espectrofotométrico: média 28,0; desvio padrão = 0,3; n = 10Método fluorimétrico: média = 26,25; desvio padrão = 0,23 ; n = 10

2

11

21

222

2112

nn

snsns

21

21

11nn

s

xxt

Existem 18 graus de liberdade, assim, da Tabela de t (P=0,05), o valor crítico é 2,1.

Como o valor experimental de t é maior do que este valor, a diferença entre os dois resultados é significante no nível de 5% e a hipótese nula é rejeitada.

267,0

0715,021010

23,01103,0110 222

s

s

7,14

101

101267,0

25,260,28

t

t

Teste F para comparar conjuntos de dados.

Utilizado:

Para determinar se uma população apresenta maior variabilidadeque a outra.

Para determinar se dois métodos diferem em precisão,

Se qual entre dois analistas ou instrumentos de laboratório émais preciso dentro de um nível de confiança desejado.

2

2

B

Ac s

sF

2As = Variância do conjunto de dados A

2Bs = Variância do conjunto de dados B

Valores críticos de F para teste mono caudal (ao nível de 5 % = p =0,05)GL 1/2 1 2 3 4 5 6 7 8 9 10 12 15 20

1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77

11 4,84 3,98 2,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,23

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12

1: nº de graus de liberdade no numerador; 2: nº de graus de liberdade no denominador.

Valor de F tabelado levando em consideração o número de graus de liberdade e o de significância (mono-caudal).

Valor de F tabelado levando em consideração o número de graus de liberdade e o de significância (bi-caudal).

Exemplo: um analista realizou analises de potássio em solução de concentraçãoconhecida durante vários dias. No primeiro dia para um conjunto de setedeterminações encontrou um desvio de 2,5 mg L-1, e no sétimo dia encontrou umdesvio de 3,3 mg L-1 (para dez replicatas). Existe alguma diferença nas determinaçõesdo analista ao nível de confiança de 95%?

Nnumerador = 9 (10-1); Ndenominador = 6 (7-1); Ftabelado = 5,523 (95%, p=0,05)

74,15,23,3

2

2

21

2º7

6,9 s

sF

O valor de F calculado (1,74) é menor do que F tabelado (4,10), dessaforma não houve diferença significativa no nível de 95% de confiançaentre os dois conjunto de dados, assim é aceita a igualdade dasvariâncias.

Exemplo: O valor aceito para o teor de zinco de uma amostra padrão obtida de umaanálise prévia é de 54,20 mg kg-1 (m/m) com desvio-padrão de 0,15 mg kg-1 (N = 5).Cinco análise da mesma amostra foram realizadas por um novo procedimentoinstrumental, obtendo-se os seguintes valores: 54,01; 54,24; 54,05; 54,27; 54,11 mg kg-1.O novo método produziu resultados consistentes com o valor aceito?

56,10144,00225,0

12,015,0

2

2

4,4 F

116,0

4054,0

1

2

Nxx

s i

O valor de Ftabelado para 4 Graus de Liberdade (N) no numerador epara 4 no denominador é igual a 9,6.

Assim, os desvios-padrão não são significativamente diferentes,pois Fcalculado Ftabelado e o novo método instrumental proporcionamos mesmos resultados do que o método de referência.

Teste-t pareado

Dois métodos de análises diferentes podem ter que ser comparados pelo estudode amostras contendo quantidades diferentes da espécie-teste (analito)

dd s

nxt

A Tabela mostra concentrações de manganês (mg kg-1) determinadas por dois

métodos diferentes para cada uma das quatro amostras:

Amostra Via Seca Via Húmida A 71 76 B 61 68 C 50 48 D 60 57

Os dois métodos dão valores médios de manganês que variam significantemente?

O teste de comparação das duas médias não pode ser aplicado neste caso, porque qualquer variação devida ao método seria disfarçada pelo efeito da diferença entre as porções-teste.

A melhor maneira de concluir se existe diferença estatística significativa entre as duas amostra é analisando a diferença entre cada par de resultados, um de cada método.

Adotando a hipótese nula de que não há diferença entre as médias deconcentrações pelos dois métodos, podemos testar se as diferenças sãosignificativamente diferentes de zero.

dd s

nxt 70,099,4475,1 t

Para os pares de valores acima, as diferenças são -5, -7, 2 e 3. A diferença média , é -1,75 e o desvio padrão para a diferença, , é 4,99. Como a equação para calcular t se torna:

d ds 0d

• O valor crítico de é 3,18 (P = 0,05) e como o valor calculado de émenor que isto, a hipótese nula é mantida.

• O método não deu diferença significativa para os valores médios daconcentração de manganês.

Alguns exemplos para aplicação do teste t pareado:

a quantidade de qualquer uma das espécies-teste ésuficiente para uma única determinação por método. os métodos serão comparados usando uma grandevariedade de amostras de diferentes fontes comdiferentes concentrações. as espécies-testes podem ser de um longo intervalode tempo e é necessário remover os efeitos sazonais

(temperatura, pressão, etc.)

0 1 2 3 4 5 60

1

2

3

4

5

6Y = 0,17508 + 0,89466 * Xr = 0,9504 (N = 803)

ICP

OE

S- S

-SO

4-2 (g

.kg-1

)

Turbidimetria - S-SO4-2 (g.kg-1)

Paired t-Test on Data1 col(Turbidimetr) and col(ICPOES):

Data Mean Variance N------------------------------------------------------------Turbidimetr 1,56715 0,87316 803ICPOES 1,57714 0,77368 803------------------------------------------------------------t = -0,97371p = 0,33049

At the 0,05 level, the two means are NOT significantly different.

TESTE ESTATÍSTICO PAR REJEIÇÃO DE RESULTADOS DISCREPANTES (OULTLIER)

Para saber se um resultado discrepante ou suspeito deve ou não serrejeitado para o cálculo do valor médio de um conjunto de dadosexperimentais, deve-se aplicar um teste estatístico. Existem váriosprocedimentos, sendo os mais utilizados:

teste de Dixon (teste Q); teste de Grubbs, teste Hampel e teste Cochran.

Teste de Dixon ou teste de confiança Q

O teste Q verifica:

Se um resultado pertence à mesma distribuição dos outros resultadoscomparando com os valores tabelados a 5% e 1% de significância.

Aplicação do teste Q:

Os resultados são ordenados em ordem crescente, indicando o número deZ que corresponde a cada determinação; 1, 2, 3, ... até o valor maior quecorresponde à determinação chamada de H, o valor anterior ao H é o H-1.

H = 3 até 7 determinações:

Extremo inferior Extremo superior

)1()()1()2(

ZHZZZQ

)1()(

)1()(ZHZHZHZQ

H = 8 até 12 determinações

)1()1()1()2(

ZHZZZQ

)2()()1()(

ZHZHZHZQ

H = 13 ou mais determinações

)1()2()1()3(

ZHZZZQ

)3()(

)2()(ZHZHZHZQ

TESTE Q

HValores críticos

95% (p = 0,05) 99% (p = 0,01)

3 0,970 0,994

4 0,829 0,926

5 0,710 0,821

6 0,628 0,740

7 0,569 0,608

8 0,608 0,717

9 0,564 0,672

10 0,530 0,635

11 0,502 0,605

12 0,479 0,579

13 0,611 0,697

14 0,586 0,670

15 0,565 0,647

16 0,546 0,627

17 0,529 0,610

18 0,514 0,594

19 0,501 0,580

20 0,489 0,567

Tabela com os valores críticos para o teste de Dixon – teste Q

Exemplos: Um analista obteve os seguintes resultados nadeterminação de amônia numa solução de concentração conhecida:29,4– 29,8– 30,8- 29,3– 31,3– 30,8 – 31,8.

As oito determinações são provenientes da mesma distribuição normal?

29,3 29,4 29,8 30,0 30,8 30,8 31,3 31,8

Z= 1 2 3 4 5 6 7 8 ou H

Z(H) = 31,8; Z(H-1) = 31,3; Z(2) = 29,4

208,04,25,0

4,298,313,318,31

)2()()1()(

ZHZHZHZQS

Cálculo para os valores superiores:

Cálculo para os valores inferiores:

05,00,21,0

3,293,313,294,29

)1()1()1()2(

ZHZZZQI

O valor critico (Qc) para 95% (p = 0,05) de significância é 0,608 (tabelado)

QS = 0,208 < Qc = 0,608

O valor 31,8 pertence à mesma distribuição normal, não devendo ser rejeitado.

QI = 0,05 < Qc = 0,608

O valor 29,3 pertence à mesma distribuição normal, não devendo ser rejeitado.

Exemplos: Foi analisado Cu em uma amostra de ração. Foram realizadas dez replicas (N=10) sendo os resultados expressos em mg L-1 conforme a tabela abaixo. Determinar quais resultados requerem rejeição.

Cobre (mg/L)15,42 15,51 15,52 15,53 15,68 15,52 15,56 15,53 15,54 15,5615,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68

Z 1 2 3 4 5 6 7 8 9 H=10

Z(H) = 15,68; Z(H-1) =15,56; Z(1) = 15,42; Z(2) = 15,51

643,0

14,009,0

42,1556,1542,1551,15

IQ 706,0

17,012,0

51,1568,1556,1568,15

SQ

QI = 0,643 QC = 0,530 (p = 0,05) O valor 15,42 não pertence à mesma distribuição normal, devendo ser rejeitado.

QS = 0,706 QC = 0,530 (p = 0,05) O valor 15,68 não pertence à mesma distribuição normal, devendo ser rejeitado.

Z(H) = 15,56; Z(H-1) =15,56; Z(1) = 15,51; Z(2) = 15,52

00,0

0,001,0

56,1556,1551,1552,15

IQ 00,0

04,00,0

52,1556,1556,1556,15

SQ

QI = 0,00 QC = 0,608 (p = 0,05)

QS = 0,00 < QC = 0,608 (p = 0,05)

Nenhum dos valores devem ser rejeitados

Cobre (mg/L)15,42 15,51 15,52 15,53 15,68 15,52 15,56 15,53 15,54 15,5615,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68

Z 1 2 3 4 5 6 7 8 9 H=10

Z * 1 2 3 4 5 6 7 H=8 *

X X

Teste de Grubbs (http://www.graphpad.com/quickcalcs/Grubbs1.cfm)

O teste de Grubbs (G) é realizado por meio da razão entre a diferença de cada resultados ( ix ) com a média de todos os resultados ( x ) em relação ao desvio padrão ( s ). Um valor é considerado como “outlier” quando o valor de “G” é maior que o valor crítico (GCRITICO) correspondente valores tabelado (GRUBBS, 1969). O teste é realizado no nível de significância de 95 % e repetido até não serem detectados outros “outliers

s

xxG i

N Critical Z N Critical Z3 1.15 27 2.864 1.48 28 2.885 1.71 29 2.896 1.89 30 2.917 2.02 31 2.928 2.13 32 2.949 2.21 33 2.95

10 2.29 34 2.9711 2.34 35 2.9812 2.41 36 2.9913 2.46 37 3.0014 2.51 38 3.0115 2.55 39 3.0316 2.59 40 3.0417 2.62 50 3.1318 2.65 60 3.2019 2.68 70 3.2620 2.71 80 3.3121 2.73 90 3.3522 2.76 100 3.3823 2.78 110 3.4224 2.80 120 3.4425 2.82 130 3.4726 2.84 140 3.49

TABELA TESTE DE GRUBBS

Exemplo: Para o mesmo conjunto de dados do exemplo anterior, calcular ovalor de G.

ix xxi 2xxi Gcalculado

29,3 -1,1 1,21 -1,206 29,4 -1 1 -1,096 29,8 -0,6 0,36 -0,658 30,0 -0,4 0,16 -0,439 30,8 0,4 0,16 0,439 30,8 0,4 0,16 0,439 31,3 0,9 0,81 0,987 31,8 1,4 1,96 1,536

2,243x 82,52xxi

4,30x

536,1912,0

4,308,318

G

912,0

782,5

1

2

n

xxs i

206,1912,0

4,303,291

sxxG i

Gcalculado= 1,536 Gtabelado= 2,13

n = 8; Nível de significância: 95%

Teste de Hampel

O teste de Hampel é considerado método robusto para detectar resultados considerados “outliers”. Inicialmente, é calculado o residual individual ( ir ) por meio da diferença do resultado do laboratório ( ix ) em relação à mediana ( Med ) de todos os resultados.

A seguir os valores obtidos dos ir , são ordenados em ordem crescente (sem considerar o sinal), sendo então encontrado o valor residual mediano ( medr ).

O valor é considerado um “outlier” quando o ir for maior do que 06,5medr ,

considerando nível de significância de 95 % (LINSINGER, et al, 1998).

Xxr ii X Mediana

irResidual absoluto

rm = residual medianori ≥ rm x 5,06OUTLIERse

ix ir *ir

29,3 -1,1 0,4 29,4 -1,0 0,4 29,8 -0,6 0,4 30 -0,4 0,6

30,8 0,4 0,9 30,8 0,4 1,0 31,3 0,9 1,1 31,8 1,4 1,4

Med =30,4 medr = 0,75

06,5medr = 3,795

= residual individual ordenado em ordem crescente e semconsiderar o sinal.

*ir

Exemplo Teste de Hampel: Para o mesmo conjunto de dados do exemploanterior.

Cobre (mg/L)15,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68

Exercício: Verificar Outlier pelos testes de Hampel e Grubbs

GRUBBS G G15,42 -1,834 1,8315,51 -0,423 0,4215,52 -0,267 0,2715,52 -0,267 0,2715,53 -0,110 0,1115,53 -0,110 0,1115,54 0,047 0,0515,56 0,361 0,3615,56 0,361 0,3615,68 2,242 2,24

Media 15,537s 0,064n 10G tabelado 2,29

ixHAMPEL

15,42 -0,11 0,1115,51 -0,02 0,0215,52 -0,01 0,0115,52 -0,01 0,0115,53 0,00 0,0015,53 0,00 0,0015,54 0,010 0,0115,56 0,03 0,0315,56 0,03 0,0315,68 0,15 0,1515,53 0,015

0,08

ixir

*ir

medr06,5medr

Med

Teste de Cochran

O teste de Cochran é usado para comparar a maior variância com as outras

variâncias de um grupo. Pode ser usado para comparar a precisão de vários

analistas ou vários métodos de análises ou vários laboratórios.

p

ii

máx

s

sC

1

2

2

2máxs = maior variância

p

iis

1

2= a soma de todas as variâncias

p = número de laboratórios, analista ou métodos

n = número de determinações realizadas por cada analista

TABELA VALOR CRÍTICO TESTE DE COCHRAN (95%)p n=2 n=3 n=4 n=52 - 0,975 0,939 0,9063 0,967 0,871 0,798 0,7464 0,906 0,768 0,684 0,6265 0,841 0,684 0,598 0,5446 0,781 0,616 0,532 0,487 0,727 0,561 0,48 0,4318 0,68 0,516 0,438 0,3919 0,638 0,478 0,403 0,35810 0,602 0,445 0,373 0,33111 0,57 0,417 0,348 0,30812 0,541 0,392 0,326 0,28813 0,515 0,371 0,307 0,27114 0,492 0,352 0,291 0,25515 0,471 0,335 0,276 0,24216 0,452 0,319 0,262 0,2317 0,434 0,305 0,25 0,21918 0,418 0,293 0,24 0,20919 0,403 0,281 0,23 0,220 0,389 0,27 0,22 0,192

TABELA TESTE DE COCHRAN

Quatro analistas analisaram uma solução de hidróxido de sódio deconcentração conhecida e encontraram os seguintes resultados:

Exemplo Teste de Cochran

Analista Determinações (%)

1 6 10,20 0,1902 6 10,00 0,4863 6 10,70 0,1794 6 10,20 0,121

O analista 2 apresenta uma variabilidade excessiva, diferente dos demais?

74,0

3189,0236,0

121,0179,0486,0190,0486,0

2222

2

C

O valor critico para p = 4 e n = 6 (para 5% de significância) é igual a 0,590 (tabelado) e para1% de significância é igual a 0,676.O valor calculado (0,74) é maior que o valor tabelado, assim conclui-se que os resultadosdo analista 2 são menos precisos do que os resultados dos outros analistas.

Numa mesma amostra de ração foi analisado o teor de fósforo, com aparticipação de 5 laboratórios diferentes; os resultados obtidos estão na tabelaabaixo. Através do teste de Cochran verificar a homogeneidade das variânciasdos laboratórios:

Laboratório P-PO4 (g/kg) Média s2

1 32,6 31,9 33,0 32,5 0,3100

2 23,7 22,0 22,7 22,8 0,7300

3 24,6 24,6 23,6 24,3 0,3333

4 30,5 30,3 31,5 30,8 0,4133

5 23,0 24,0 24,8 23,9 0,8133

3168,0]8133,04133,03333,07300,03100,0[

8133,0

C

p

ii

máx

s

sC

1

2

2

p = 5 e n = 3

Valor critico para 5% de significância: 0,684

Valor critico para 1% de significância: 0,788

O valor calculado (0,3168) é menor que o valor tabelado, assim conclui-se que o valorcalculado é menos variável, isto é, mais preciso. Não deve ser rejeitada a variância doLAB. 5.

Controle de Qualidade

CIQ CEQ

Objetivo: manter as condições de validação no laboratório por longo tempo

CIQ

Repetições de análises

Uso de materiais de referência

Uso de cartas controle

CEQObjetivo: assegurar a comparabilidade dos resultados entre laboratórios

Participação em Ensaios de Proficiência(programas interlaboratoriais)

desenvolvimento e operação de programas de ensaio de ... · caracteriza a faixa de valores,...

Documents