desenvolvimento e operação de programas de ensaio de ... · caracteriza a faixa de valores,...
TRANSCRIPT
Desenvolvimento e operação de programas de ensaio de proficiência
Gilberto Batista de Souza
Embrapa Pecuária Sudeste
OUTUBRO / 2010
XV Encontro Nacional sobre Metodologias e Gestão de Laboratórios da EMBRAPA – XV MET
Embrapa Clima Temperado – PELOTAS - RS
ESCOPO DO CURSO
CONCEITOS DE METROLOGIA QUIMICA
CONCEITOS DE TERMOS ESTATISTICOS
ESTATÍSTICA APLICADA NO TRATAMENTO DE DADOS
TESTES DE SIGNIFICÂNCIA
TESTES ESTATISTICOS PARA DETECÃO DE OUTLIERS
PROTOCOLO INTERNACIONAL HARMONIZADO PARA ENSAIO DE
PROFICIÊNCIA EM LABORATÓRIOS ANALÍTICOS (QUÍMICOS)
Conceitos básicos de metrologia
Incerteza das medições: Parâmetro, associado ao resultado de umaMEDIÇÃO, que caracteriza a dispersão dos valores que podem serfundamentadamente atribuídos a um mensurando (VIM, 2007).
Caracteriza a faixa de valores, dentro da qual o valor real deve se situar,com um nível de confiança especificado.
Incerteza da medição não implica em dúvida quanto a validade de umamedição; ao contrário, o conhecimento da incerteza implica numa maiorconfiança na validade do resultado de uma medição.
Possíveis fontes de Incerteza
Má definição do mensurando; Amostragem não-representativa;
Erro pessoal na leitura de instrumentos analógicos; Resolução do instrumento;
Valores inexatos dos padrões de medição e materiais de referência;
Ajuste de curva; interpolação; etc
Valor verdadeiro: valor atribuído a uma grandeza específica e aceito, àsvezes por convenção, como tendo uma incerteza apropriada para umadada finalidade (EURACHEM/CITAC, 1998).
O valor verdadeiro convencional pode ser denominado como:
valor designado,
melhor estimativa do valor,
valor convencional ou valor de referência.
Frequentemente um grande número de resultados das medições de umagrandeza é utilizado para estabelecer um valor verdadeiro convencional.
Precisão: está relacionada com a concordância das medidas entre si, ou seja, quanto maior a dispersão dos valores menor a precisão (relacionada com a repetitividade e com a reprodutibilidade).
Quanto menor a dispersão dos valores maior a precisão
Quanto menor a amplitude maior a precisão
3
4
5
6
7
1 2 3 4 5 6 7 8 9 10
É um tipo de precisão referente a medições feitas sob condições de repetitividade,
isto é:
mesmo método;
mesmo material;
mesmo operador;
mesmo laboratório;
repetições em curto período de tempo.
Repetitividade (r)
É calculada a partir do desvio padrão dos resultados dos ensaios sob condição
de repetitividade - recomenda-se 7 ou mais repetições para o cálculo do desvio
padrão para cada concentração.
É aconselhável calcular o limite de repetitividade “r” que capacita o analista a
decidir se a diferença entre análises duplicatas de uma amostra, determinada sob
condições de repetitividade, é significante.
O limite de repetitividade (r) para um nível de significância de 95% e 6 graus
de liberdade (N = n-1), é dado por:
sr = desvio padrão de repetitividade. rsr 8,2
Repetitividade (r)
É um conceito de precisão referente a medições feitas sob condições de
reprodutibilidade, isto é:
mesmo método;
operadores diferentes;
laboratórios diferentes;
equipamentos diferentes;
longo período de tempo.
Reprodutibilidade (R)
Embora a reprodutibilidade não seja um componente de validação de método
executado por um único laboratório, é considerada importante quando um
laboratório busca a verificação do desempenho dos seus métodos em relação aos
dados de validação obtidos por meio de comparação interlaboratorial.
Reprodutibilidade (R)
A partir do desvio padrão obtido sob condições de reprodutibilidade é possível
calcular o limite de reprodutibilidade “R”, o qual permite ao analista decidir se a
diferença entre os valores da duplicata das amostras analisadas sob condições de
reprodutibilidade é significante.
O limite de repetitividade (r) para um nível de significância de 95%, é dado por:
28,2 RSR 2RS = variância de reprodutibilidade associada aos resultados considerados, para
cada laboratório.
O cálculo da reprodutibilidade é efetuado para cada nível, separadamente, após eliminação dos valores dispersos.
Labs A B C D E F Média s s21 0,27 0,28 0,28 0,27 0,28 0,28 0,2767 0,0052 0,00002672 0,301 0,3 0,302 0,304 0,304 0,301 0,3020 0,0017 0,00000283 0,285 0,288 0,295 0,282 0,29 0,288 0,2880 0,0044 0,00001964 0,292 0,279 0,287 0,316 0,281 0,291 0,2910 0,0133 0,00017725 0,276 0,27 0,281 0,27 0,28 0,277 0,2757 0,0048 0,00002276 0,282 0,284 0,285 0,287 0,286 0,285 0,2848 0,0017 0,00000307 0,277 0,279 0,28 0,273 0,278 0,28 0,2778 0,0026 0,00000708 0,246 0,256 0,249 0,241 0,245 0,243 0,2467 0,0053 0,00002839 0,28 0,278 0,284 0,281 0,275 0,277 0,2792 0,0032 0,000010210 0,3 0,307 0,311 0,309 0,307 0,306 0,3067 0,0037 0,000013911 0,301 0,29 0,284 0,308 0,293 0,284 0,2933 0,0096 0,000091912 0,272 0,277 0,269 0,27 0,278 0,27 0,2727 0,0039 0,0000151
Somatória 0,0004181
Anova: fator único
RESUMOLab Contagem Soma Média Variância
1 6 1,66 0,2766667 0,00002672 6 1,812 0,302 0,00000283 6 1,728 0,288 0,00001965 6 1,654 0,2756667 0,00002276 6 1,709 0,2848333 0,00000307 6 1,667 0,2778333 0,00000708 6 1,48 0,2466667 0,00002839 6 1,675 0,2791667 0,000010210 6 1,84 0,3066667 0,000013912 6 1,636 0,2726667 0,0000151
ANOVAFonte da variação SQ gl MQ F valor-P F críticoEntre grupos 0,014834 9 0,0016482 110,59283 7,56E-30 2,073351Dentro dos grupos 0,000745 50 0,0000149
Total 0,015579 59
Ex. para calcular r e R
00027218,06
0000149,0001648,02
entres
011,0 0,00001498,2 r
047,000027218,00000149,08,2 R
Q1: Um laboratório obtém 2 replicatas: 0,273 e 0,279%; a diferença de 0,006%entre as duas replicatas é aceitável, pois r = 0,011, portanto os dois resultadossão válidos.
Q2: Um laboratório obtém e replicatas : 0,269 e 0,299%; a diferença de 0,017%entre as duas replicatas é inaceitável (r = 0,011); um dos valores deve serrejeitado.
Q3: Dois labs.: um obtém 0,269% e o outro 0,299%; a diferença de 0,030% entreos dois resultados é menor que o valor de R = 0,047; portanto os dois valoressão aceitos.
Exatidão: Grau de concordância entre o resultado de uma medição e umvalor verdadeiro do mensurando (VIM, 2007).
Está relacionada com o seu erro absoluto, isto é, com a proximidade do valormedido em relação ao valor verdadeiro da grandeza.
Avaliada por meio da comparação entre o valor medido e o valor certificadode um CRM.
Comparando com resultados obtidos por intermédio da utilização de ummétodo já existente e de exatidão conhecida.
Comparando os resultados obtidos por intermédio da adição padrão à umamatriz.
EXATIDÃO E TENDÊNCIA (bias)
Exatidão do método é definida como sendo a concordância entre o resultado deum ensaio e o valor de referência aceito como convencionalmente verdadeiro.
Os processos normalmente utilizados para avaliar a exatidão de um método são,entre outros: uso de materiais de referência, participação em comparaçõesinterlaboratoriais e realização de ensaios de recuperação.
A exatidão, quando aplicada a uma série de resultados de ensaio, implica numacombinação de componentes de erros aleatórios e sistemáticos.
Estudante Resultado (mL) Comentário
A 10,08 Preciso e inexato 10,11 10,09 10,10 10,12
B 9,88 Exato e impreciso 10,14 10,02 9,80 10,21
C 10,19 Impreciso e inexato 9,79 9,69 10,05 9,78
D 10,04 Preciso e exato 9,98 10,02 9,97 10,04
EXATIDÃO E TENDÊNCIA (bias)
A tendência é algumas vezes chamada de recuperação de um método analítico,é o erro sistemático desse sistema de medição.
Além da avaliação da tendência, é importante estimar a incerteza de medidaassociada à tendência e incluir este componente na estimativa global da incertezade medição.
A tendência de um método analítico é geralmente determinada pelo estudo demateriais de referência ou por adição padrão (fortificação).
A tendência pode ser expressa como uma recuperação analítica:
100(%)Re
3
21
CCCcuperação
Recuperação: É a fração do analito adicionado na amostra teste (fortificada)previamente a análise. Geralmente é realizada com no mínimo 6 repetições dobranco da matriz ou amostra não fortificada e amostra fortificada com o analito adiferentes concentrações.
C1 = concentração determinada na amostra fortificada;
C2 = concentração determinada na amostra não fortificada e
C3 = concentração adicionada.
Na avaliação da exatidão utilizando um material de referência certificado (MRC):os valores obtidos pelo laboratório, média e o desvio padrão de uma série deensaios em replicatas, devem ser comparados com os valores certificados domaterial de referência.
Para esta comparação podem ser utilizados diversos critérios de decisão, entre osquais: erro relativo; teste de hipóteses; índice z, e erro normalizado.
EXATIDÃO E TENDÊNCIA (bias)
Erro relativo (ER): 100
verdadeiro
verdadeiromedido
XXXER ; medidoX = média do
valor medido experimentalmente e verdadeiroX = valor aceito como verdadeiro
(valor certificado do MRC).
Erro relativo (ER):
Teste de hipóteses: teste F para verificar se as variâncias das amostras
podem ser consideradas iguais, seguido do teste t de Student (ver INMETRO:
DOQ-CGCRE-008 – Revisão 02 – JUNHO/2007).
Teste de hipóteses
Índice z: o índice z é também um modo de avaliar o desempenho do laboratório,
utilizando MRC:
sXXz verdadeiromedido ; medidoX = média do valor medido
experimentalmente; verdadeiroX = valor aceito como verdadeiro (valor certificado do MRC) e s = desvio padrão (incerteza) do MRC.
A avaliação segue o seguinte critério: se 2z o resultado é satisfatório;
32 z o resultados é questionável e 3z o resultados é insatisfatório.
Erro normalizado En: Caso o laboratório calcule a incerteza do seu resultado ( labU ), o valor verdadeiro ( VerdadeiroX ) deve estar dentro do intervalo labX ± incerteza expandida.
22
.
reflab
verdlabn
UUXXE
1nE o resultado pode ser considerado adequado
EXATIDÃO E TENDÊNCIA (bias)
Linearidade
Para métodos quantitativos é determinada pela medição de amostras com
concentrações de analito abrangendo a faixa reivindicada do método.
Linearidade é a habilidade de um método analítico em produzir resultados que sejam
diretamente proporcionais à concentração do analito em amostras, em uma dada faixa
de concentração.
Os resultados são usados para obter uma reta por regressão com relação ao cálculo
de analito, usando-se o método dos mínimos quadrados.
É conveniente que um método seja linear ao longo de uma faixa específica, mas este
não é um requisito absoluto. Quando a linearidade for inatingível para um
procedimento específico, deve ser determinado um algoritmo adequado para
cálculos.
A equação da reta que relaciona as duas variáveis é:
y = resposta medida ou sinal analítico (absorbância, altura ou área do pico, etc.);
x = concentração;
a = interseção com o eixo y, quando x = 0;
b = inclinação da curva analítica = sensibilidade (S).
O método é mais sensível quando pequenas variações de concentração
resultam em maior variação na resposta, ou seja, maior inclinação (b).
Em geral, serão necessários vários níveis de concentração, no mínimo cinco, para
construir a curva analítica. O número de replicatas em cada nível de concentração
deve ser o mais próximo possível daquele empregado na rotina do laboratório.
Linearidade
Linearidade
PERGUNTAS:
1) É linear o gráfico de calibração? Se for uma curva, qual a forma?
2) Sabendo-se que um dos pontos da reta de calibração está sujeito a erros, qual é a
melhor reta que passa pelos pontos?
3) Supondo que a calibração é realmente linear, quais são os erros estimados e o
limites de confiança para a inclinação e interseção na origem da reta?
4) Quando o gráfico de calibração é utilizado para análises de amostras, quais são
os erros e os limites de confiança para a concentração determinada?
5) Qual o limite de detecção do método? Isto é, qual a menor concentração do
analito que se pode detectar com um nível de confiança predeterminado?
A linearidade de um método pode ser observada pelo gráfico dos resultados dos
ensaios em função da concentração do analito e verificada a partir da equação da
regressão linear, determinada pelo método dos mínimos quadrados. Para tal, deve
ser verificada a ausência de valores discrepantes para cada nível de concentração e
a homocedasticidade dos dados, antes de fazer a regressão linear.
Linearidade
A verificação da ausência de valores discrepantes pode ser feita pelo teste de
Grubbs
A homocedasticidade, isto é, homogeneidade da variância dos resíduos pelo
teste de Cochran.
s
xxG i
p
ii
máx
s
sC
1
2
2
Grubbs Cochran
TABELA VALOR CRÍTICO TESTE DE COCHRAN (95%)p n=2 n=3 n=4 n=52 - 0,975 0,939 0,9063 0,967 0,871 0,798 0,7464 0,906 0,768 0,684 0,6265 0,841 0,684 0,598 0,5446 0,781 0,616 0,532 0,487 0,727 0,561 0,48 0,4318 0,68 0,516 0,438 0,3919 0,638 0,478 0,403 0,35810 0,602 0,445 0,373 0,33111 0,57 0,417 0,348 0,30812 0,541 0,392 0,326 0,28813 0,515 0,371 0,307 0,27114 0,492 0,352 0,291 0,25515 0,471 0,335 0,276 0,24216 0,452 0,319 0,262 0,2317 0,434 0,305 0,25 0,21918 0,418 0,293 0,24 0,20919 0,403 0,281 0,23 0,220 0,389 0,27 0,22 0,192
TABELA TESTE DE COCHRANTABELA TESTE DE GRUBBS
N Critical Z N Critical Z3 1.15 27 2.864 1.48 28 2.885 1.71 29 2.896 1.89 30 2.917 2.02 31 2.928 2.13 32 2.949 2.21 33 2.95
10 2.29 34 2.9711 2.34 35 2.9812 2.41 36 2.9913 2.46 37 3.0014 2.51 38 3.0115 2.55 39 3.0316 2.59 40 3.0417 2.62 50 3.1318 2.65 60 3.2019 2.68 70 3.2620 2.71 80 3.3121 2.73 90 3.3522 2.76 100 3.3823 2.78 110 3.4224 2.80 120 3.4425 2.82 130 3.4726 2.84 140 3.49
Calcular o modelo através da regressão linear, os resíduos e o coeficiente de
correlação linear (r).
O coeficiente de correlação linear (r) é freqüentemente usado para indicar o quanto
pode ser considerada adequada a reta como modelo matemático.
Um valor maior que 0,90 é, usualmente, requerido (coeficientes de correlação r e
determinação R2).
Linearidade
Coeficiente de correlação (r):
Coeficiente que indica a força da associação entre quaisquer duas variáveis
métricas. O sinal (+ ou -) indica a direção da relação.
O valor pode variar de -1 a +1, em que +1 indica uma perfeita relação positiva, 0
(zero) indica relação nenhuma e -1 uma perfeita relação negativa ou reversa
(quando uma variável se torna maior a outra fica menor).
Coeficiente de determinação (R2):
Medida da proporção da variância da variável dependente em torno de sua media
que é explicada pelas variáveis independentes.
O coeficiente pode variar entre 0 e 1. Se o modelo de regressão é propriamente
aplicado e estimado, pode-se assumir que quanto maior o valor de R2, maior o poder
de explicação da equação de regressão e, portanto, melhor a previsão da variável
dependente.
Linearidade
ErrosQualquer resultado de uma medida experimental está associada a um erro, ouseja, a uma incerteza.Esta incerteza é considerada a diferença entre o valor medido e o valor verdadeiro.
Os erros podem ser classificados em três categorias:
grosseiros, aleatórios (randômicos) ou indeterminados e sistemáticos oudeterminados.
Erros grosseiros são facilmente reconhecidos. Eles são erros tão sérios quenão deixam alternativas a não ser refazer todo o experimento.
Exemplos incluem a quebra do equipamento, contaminação de reagentes,erros na adição de alíquotas, etc.
Enganos na leitura de uma escala
Erro de cálculos nas operações
Erros na adição de alíquotas
Ocorrem em geral pela falta de cuidado ou inabilidade de fazer uma determinada análise
Erros Aleatórios:
Não possuem valor definido, é resultante de uma medição menos a média de umnúmero infinito de medições sob condições de repetitividade e flutuam de maneiraaleatória (são bidirecionais).
XxrioErroAleató i
• São irregulares e resultam em variabilidade afetando o desvio padrão.
• Não tem causas assimiláveis,
• Podem ser submetidos a tratamento estatístico para permitir saber qual o valor
mais provável e também a precisão de uma série de medidas.
Estimativa do valor mais provável
Precisão de uma série de medidas.
Submetidos a tratamento estatístico
PERMITIR
ERROS ALEATÓRIOS
ERRO ALEATÓRIO
PRECISÃO3
4
5
6
7
1 2 3 4 5 6 7 8 9 10
Erros Sistemáticos
São inúmeros e foram agregados em quatro grupos:
São unilaterais resultando um desvio constante nos resultados, tem causasassimiláveis e estão relacionados com a exatidão, sendo geralmentecaracterizados por conservarem o mesmo valor em medições sucessivas.
CLASSIFICAÇÃO
Erros de métodos Erros operacionais Erros pessoais Erros instrumentais
Afetam a grandeza do resultado
Afetam a média de um conjunto de resultados
Afetam a exatidão
São erros que resultam de causas constantes que alteram de modo uniforme os resultados das medidas
ERRO SISTEMÁTICO EXATIDÃO
3
4
5
6
7
1 2 3 4 5 6 7 8 9 10
São erros que resultam de causas constantes que alteram de modo uniforme os resultados das medidas
ixErro 100%
ixErro
Cálculos dos erros:
Os erros podem ser analisados de forma rápida, através das seguintes equações:
= valor verdadeiro, p.e. resultado de um material de referência;
xi = resultado de uma medida experimental.
CONCEITO DE TERMOS ESTATÍSTICOS
Elemento: a unidade considerada para um estudo estatístico édenominada de elemento. Exemplo: um objeto; um individuo, uma peça.
População: conjunto de elementos que tem pelo menos uma característicaem comum. Esta característica deve delimitar corretamente quais são oselementos da população que podem ser animados ou inanimados.Exemplos: um lote de peças; um lote de um polímero; população do estadode São Paulo.
Amostra: subconjunto de elementos de uma população. Este subconjuntodeve ter dimensão menor que o da população e seus elementos devem serrepresentativos da população.
Graus de liberdade (N):
é um conceito ligado ao número de dados disponíveis (livres) para ocálculo da estatística. Por exemplo, ao estimarmos a média populacional() com a média amostral ( ) perdemos um grau de liberdade, assim aestatística t-student terá n-1 graus de liberdade.
x
Distribuição normal:Uma variável quantitativa segue uma distribuição normal, se sua distribuiçãode freqüências tem o formato similar ao de um sino (curva de Gauss), ouseja, a maioria dos valores se concentra em torno da média e, a medida quese afasta do centro as observações são cada vez mais raras. Essadistribuição é considerada simétrica. Muitas variáveis têm essa distribuição,tais como altura das pessoas adultas do sexo masculino, coeficiente deinteligência, etc.
Histograma:
É um gráfico de colunas justapostas que representa uma distribuição de freqüênciapara dados contínuos ou uma variável discreta quando esta apresentar muitosvalores distintos. No eixo horizontal são dispostos os limites das classes segundoas quais os dados foram agrupados enquanto que o eixo vertical corresponde àsfreqüências absolutas ou relativas das mesmas.
87 88 89 90 91 92 93 94 95 960
10
20
30
40
Freq
uenc
ia (%
)
MS (%)
M 92,20Med 92,24Mo 92,20
Medidas de assimetria:
A medida de assimetria é um indicador da forma da distribuição dos dados.
Ao construir uma distribuição de freqüências e/ou um histograma, está-sebuscando, também, identificar visualmente, a forma da distribuição dos dadosque é ou não confirmada pelo coeficiente de assimetria de Pearson (As) definidocomo:
MoAS
para dados populacionais para dados amostrais
sMoXAS
Simétrica: média = mediana = moda ou As = 0
assimétrica negativa: média ≤ mediana ≤ moda ou As < 0
O lado mais longo do polígono de freqüência (cauda dadistribuição) está à esquerda do centro.
O lado mais longo do polígono de freqüência está à direita do centro.
assimétrica positiva : moda ≤ mediana ≤ média ou As > 0
Etapas para construção de tabelas de freqüências e histogramas:
- Coletar n amostras entre 30 < n < 200.
- Calcular a amplitude:
- Encontrar o valor máximo (Vmax) e mínimo (Vmin) dos dados em estudo.
minmax VVR
- Determinar o numero de classes de freqüência: nk
- Calcular a amplitude dos intervalos das classes:kRh
outra forma de calcular é dividir por 1, 2 ou 5 de forma a obter-se de 5 a20 intervalos de classes, de igual amplitude.
- Definir o limite superior e inferior de cada classe e seu ponto médio.- Construir uma tabela de freqüência.- Traçar o diagrama.
Exemplo: Foi realizado um levantamento de três meses dos resultados dasanálises de proteína (%) em amostra de farelo de trigo. Com os dados,construir um histograma para as análises.
16,4 16,4 15,8 17,7 17,6 17,7 17,3 16,7 17,4 16,8
16,9 17,0 16,9 16,9 16,5 16,7 16,6 16,6 16,6 16,4
16,7 16,6 16,8 16,0 16,9 16,8 17,4 17,0 16,9 16,4
16,5 16,9 16,6 16,6 16,7 16,8 16,6 16,5 17,0 17,0
16,8 16,8 16,8 16,6 17,0 16,9 17,1 16,4 16,8 16,7
17,1 16,7 17,0 16,7 16,2 16,8 17,2 17,5 16,7 16,9
17,0 16,6 16,8 17,2 17,0 17,0 16,8 16,9 16,4 16,6
16,6 16,9 16,8 17,1 16,6 16,9 16,8 17,0 16,0 16,6
- Tamanho da amostra: 80n
minmax VVR 9,18,157,17 R- Amplitude:
nk 80k 94,8k- Classes de freqüência:
kRh 2,00,212
94,89,1
h- Amplitude das classes:
- Tabela de freqüência:
Limites das classes Código da classe
Freqüência (contagem)
Freqüência (%)
15,8 ≤ x < 16,0 A 1 1,25
16,0 ≤ x < 16,2 B 2 2,5
16,2 ≤ x < 16,4 C 1 1,25
16,4 ≤ x < 16,6 D 9 11,25
16,6 ≤ x < 16,8 E 21 26,25
16,8 ≤ x < 17,0 F 24 30
17,0 ≤ x < 17,2 G 13 16,25
17,2 ≤ x < 17,4 H 5 6,25
17,4 ≤ x < 17,6 I 2 2,5
17,6 ≤ x < 17,7 J 2 2,5
Total (n) 80- Histograma:
0
5
10
15
20
25
30
35
A B C D E F G H I J
Código da Classe
Freq
uênc
ia (%
)
Estatística Aplicada no Tratamento e Avaliação de Dados:
Uma vez que as medidas reais contêm erros experimentais, é praticamenteimpossível estar completamente certo de um resultado.
O erro aleatório pode ser determinado e desta forma, todos os resultadosanalíticos devem estar associados a uma incerteza, ou intervalo de confiança.
A estimativa da incerteza pode se basear no nível de qualidade da leitura deuma medida num dado equipamento, ou na experiência do analista com umdeterminado método.
Sempre que possível, a incerteza deve ser expressa como um desvio padrãode uma série de medidas em replicatas.
Sempre que possível a qualidade, das medidas experimentais, deve serverificada para avaliar a confiabilidade dos resultados analíticos.
Media ( ): a média aritmética, que é normalmente abreviada para média,é a soma de todos os valores obtidos dividida pelo número de medidas (n):
;x
Média amostral:
n
xx
n
ii
1
Média populacional:N
xN
ii
1
Mediana (Med): a mediana é o valor central de um conjunto de dadosarranjados em ordem crescente ou decrescente, ou seja, é o valor de talmagnitude que, o número de dados menores do que ele é igual ao númerode dados maiores do que ele.
Replicatas Valor Replicatas Valorx1 5,2 x10 4,7x2 4,8 x6 4,7x3 5,1 x2 4,8x4 4,9 x8 4,8x5 5,2 x4 4,9x6 4,7 x3 5,1x7 5,2 x1 5,2x8 4,8 x5 5,2x9 5,3 x7 5,2x10 4,7 x9 5,3
Média 4,99Mediana 5,00
Replicatas Valor Replicatas Valorx1 5,2 x10 1,0x2 4,8 x6 4,7x3 5,1 x2 4,8x4 4,9 x8 4,8x5 5,2 x4 4,9x6 4,7 x3 5,1x7 5,2 x1 5,2x8 4,8 x5 5,2x9 20,0 x7 5,2x10 1,0 x9 20,0
Média 6,09Mediana 5,00
Replicatas Valor Replicatas Valorx1 5,2 x10 1,0x2 4,8 x6 4,7x3 5,1 x2 4,8x4 4,9 x8 4,8x5 5,2 x4 4,9x6 4,7 x3 5,1x7 5,2 x1 5,2x8 4,8 x5 5,2x9 20,0 x7 5,2x10 1,0 x9 20,0
Média 6,09Mediana 5,00
• Quando a quantidade de dados (n) é impar, a mediana é o valor que ocupaa posição central;
• Quando a quantidade de dados (n) é par, há duas posições centrais na listaordenada; assim, a mediana da amostra é a média aritmética dos doisvalores que ocupam as posições ventrais.
Moda (Mo): é o valor amostral que tem a maior freqüência, ou seja, é oencontrado em maior número de vezes, portanto, é a observação mais"provável" da distribuição dos dados.Portanto, numa amostra a moda pode não existir. Uma distribuição em que nãohá elementos repetidos é dita amodal.
Também se considera que a moda pode não ser única. Se dois valoresaparecem em igual quantidade de vezes a distribuição é dita bimodal. Para trêsvalores, trimodal, e assim, sucessivamente.
Importante é notar que se existe apenas uma moda em uma amostra, há apenasum grupo de indivíduos com suas variações, ou seja, a amostra é homogênea.
Mas, se houver duas ou mais modas, há grupos diferentes dentro daquelaamostra. Diz-se, então, que a amostra é heterogênea.
Exemplo: Os valores de medidas de uma amostra foram os seguintes: 3, 3, 4,5, 5, 6, 6, 6, 7, 8, 9, 9; calcular a Moda dos resultados obtidos:Resposta: a moda é o valor 6, porque corresponde ao valor com maior
freqüência, é o valor que mais ocorre.
Desvio: a diferença entre qualquer resultado de uma análise ( ) e a média dasérie de resultados é denominado de desvio da média (d). O desvio é positivo seo valor é maior do que a média, ou negativo se for menor do que a média:
ix
xxd i
1n
Variância: é definida como sendo a soma dos quadrados dos desvios emrelação à média, dividida pelo número de observações da amostra menos um.
Para não trabalhar com valores negativos obtidos na diferença, trabalha-se comvalores absolutos ou eleva-se ao quadrado. Sendo mais fácil, elevar aoquadrado e tirar a média, o valor resultante é simbolizado por e chama-sevariância amostral:
2s
1
1
2
2
n
Xxs
n
ii
Desvio Padrão Experimental ( ): a definição mais útil para a dispersão dosdados experimentais é o desvio padrão, é utilizado freqüentemente para avaliara precisão dos resultados em um conjunto de dados realizados em replicatas. Aestimativa do desvio padrão é calculado extraindo-se a raiz quadrada doquociente obtido dividindo a soma dos quadrados dos desvios ( ) individuaispelo número de determinações menos uma unidade:
s
d
11
2
n
xxs
n
ii
Coeficiente de variação: é frequentemente utilizado o conceito de coeficientede variação (cv%), também conhecido como desvio padrão relativo (DPR). Asunidades são, expressas em porcentagem e são exemplos de erros relativos,isto é, um erro estimado dividido por uma estimativa do valor absoluto daquantidade medida. Erros relativos são frequentemente usados na comparaçãoda precisão de resultados que têm diferentes unidades ou magnitudes, e sãotambém importantes no estudo da propagação de erros.
xscv
100%
São exemplos de erros relativos
Erros relativos são frequentemente usados na comparação daprecisão de resultados que têm diferentes unidades ou magnitudes
São também importantes no estudo da propagação de erros.
s DISPERSÃO PRECISÃO CV
Coeficiente de variação (CV):
Taverniers, I. ; De Loose, M.; van Bockstaele, E. Trends in quality in the analytical laboratory. II. Analyticalmethod validation and quality assurance. Trends in Analytical Chemistry, Vol. 23, No. 8, 2004
cv(%) X Concentração
Exemplo: considere os valores da porcentagem de proteína em uma ração,obtido por um analista:
% PB
31,62 31,76 31,60
31,47 31,71 31,60
31,64 31,53 31,71
Podemos observar através da tabela que: o valor de 31,62 é a mediana umavez que há quatro valores menores e quatro valores maiores do que o valor31,62.
E ao aplicarmos as fórmulas para a média e para o desvio padrão, obtêm-seos seguintes valores, sendo que os resultados podem ser expressosassociados ao erro: 31,63 ± 0,09.
Mediana Desvio Padrão (s)
Coeficiente de variação
(cv%)
31,62 31,63 0,09 0,28
x
Intervalo de confiança: Geralmente somente é realizado um pequeno númerode determinações em duplicatas, triplicatas, etc., tornando-se necessárioexaminar como estes dados podem ser interpretados de uma maneira lógica.
Uma análise mais detalhada mostra que, sejam quais forem os valores de ede , aproximadamente 68% da população situa-se entre ±1 da média,aproximadamente 95% está entre ±2 e que aproximadamente 99,7% situa-seentre ±3 da média.
O Intervalo de Confiança e os valores extremos deste limite sãoconhecidos como Limites de Confiança.
O termo “confiança” implica que podemos assegurar com certo grau deconfiança, e com certa probabilidade, que o Intervalo de Confiança incluio valor real.
O tamanho do intervalo de confiança depende de quanto nós queremosque ele inclua o valor real.
Quanto maior a certeza, maior o intervalo requerido.
O desvio padrão pode ser utilizado paracalcular os limites dentro do qual o valorverdadeiro se situa a um dado nível deprobabilidade.
Para verificar a probabilidade de o valorexperimental estar próximo do valor real,utiliza-se o teste estatístico denominado de“t “ de Student.
Mesmo a partir de um número limitado demedidas é possível encontrar a médiaverdadeira.
É preciso calcular a média experimental, , e o desvio padrão, .
xs
O Intervalo de Confiança é uma expressão que estabelece que a médiaverdadeira, , se situa dentro de certa distância da média experimental,sendo expresso pela fórmula:
Ntsx
EXEMPLO: Utilizando os dados do exemplo anterior, onde (n=9), podemosdeterminar o Intervalo de Confiança para um nível de probabilidade de 95%empregando a equação para o teste “t “:
63,31x
09,0s0
007,063,319
09,0306,263,31
A porcentagem de proteína encontrada pode ser expressa por: 31,63 ± 0,07%.
Isto significa que a probabilidade do valor real se situar no intervalo de 31,56% a31,70% é de 95%.
É evidente que se aumentarmos o nível de confiança para 99% o intervalo deconfiança se estenderá.
Exemplo: O conteúdo de íons sódio de uma espécie de urina foi determinadousando um fotômetro de chama. Os seguintes valores foram obtidos: 102, 97, 99,98, 101, 106 mg L-1. Quais são os limites de confiança para 95% e 99% deconfiança para a concentração dos íons sódio.
nstx - o limite de confiança para 95% é dado por: 627,357,25,100
= 100,5 ± 5,4 mg L-1
- Similarmente, para 99% de limite de confiança: 627,303,45,100
= 100,5 ± 5,4 mg L-1
x = 100,5 mg L-1 S = 3,27 mg L-1 56 Nn
99% (P = 0,01) tCRÍTICO = 4,03
Limite de Confiança 95% (P = 0,05) tCRÍTICO = 2,57
Exemplo: Dez amostras são retiradas de um lote de calcário e analisadas.
O teor de Cálcio apresentou uma = 4,30% (m/m) e um desvio-padrãoestimado, = 0,30% (m/m). Qual é o intervalo de confiança, no nível de 95%,da média do lote?
xs
n = 10; t95 = 2,262; x = 4,30%; s = 0,30%
nstx 10
30,0262,230,4
%21,0%30,4
Exemplo: Um químico para avaliar o método de quantificação para cobre,preparou uma solução conhecida de Cu de 50 mg L-1. Esta solução foianalisada seis vezes por absorção atômica, tomando para cada determinaçãoalíquotas de 10 mL. Foram encontrados os seguintes resultados: 48,2; 51,0;46,6; 51,5; 43,8; 46,9 mg L-1.
Calcular a média, mediana, desvio das medidas, desvio padrão, coeficientede variação e o intervalo de confiança?
Valores (mg L-1) 43,8 46,6 46,9 48,2 51,0 51,5
Freqüência 1 1 1 1 1 1
Média: Lmgnx
x i /486
288
Mediana Neste caso a mediana corresponde ao valor do meio entre:
46,9 e 48,2 = 47,5
Desvios das medidas
Determinação Desvio em relação à média Desvio ao quadrado
xx xx 2xx
43,8 - 48 -4,2 17,64
46,6 - 48 -1,4 1,96
46,9 - 48 -1,1 1,21
48,2 - 48 0,2 0,04
51,0 - 48 3,0 9,00
51,5 - 48 3,5 12,25
Total 0 xxi 10,422 xxi
Desvio Padrão Lmg
nxx
s i /902,242,81
2
Coeficiente de Variação: %04,648
100902,2100
xSCV
nstx 6902,2571,248
05,348
Intervalo de Confiança no nível de 95%:
Umas das propriedades mais importantes de um método analítico é que eledeve ser isento de erros sistemáticos, isto é, o valor calculado pelo métododeve ser o valor real.
Entretanto, erros aleatórios fazem com que o valor medido raramente sejaexatamente igual ao valor real.
Para decidir se a diferença entre o valor medido e o valor padrão pode seratribuído a estes erros aleatórios, um teste estatístico, conhecido como teste designificância, pode ser empregado.
TESTES DE SIGNIFICÂNCIA
Testes estatístico para decidir se existe diferença significativaentre o valor medido e o valor padrão.
Ferramentas importantes para validação de resultados
Verificar se um resultado individual, no conjunto de resultados, pode ser considerado discrepante (Outlier)
Verificar se existe diferença estatisticamente significativa entre a Média de valores experimentais com um valor considerado verdadeiro
Se há ou não diferenças estatisticamente significativas, na precisão dos resultados de dois conjuntos de valores
Se um valor médio de um conjunto de resultados é significativamente diferente de um outro valor médio obtido
Valor probabilistico do limite de rejeição da Hipótese nula (H0), do erroTipo I. Em geral adota-se o valor alfa de 0,05 ou 0,01, admitindo-se, aorejeitar a H0, a probabilidade de ocorrência de 1 erro em 20 (5%) ou 1 em100 (1%), respectivamente.
Hipótese nula (H0): é a hipótese que se testa considerando-se não haver diferenças entre grupos específicos objetos de estudo.
Hipótese alternativa (H1): é a hipótese que contraria a de nulidade, no sentido de afirmar que há diferença entre grupos específicos objetos da pesquisa
TIPO 1: consiste em aceitar, como diferentes, médias de tratamentos que na verdade são iguais
TIPO 2: consiste em aceitar, como iguais, médias de tratamentos que na verdade são diferentes
ERRO
Teste mono-caudal (unilateral)
Teste estatístico no qual a H1 especifica a direção da diferença as serdetectada, assim representado: 1 0 ou 1 0
Teste bi-caudal (bi-lateral)
Teste estatístico no qual a H1 (hipótese alternativa) não especifica adireção da diferença as ser detectada, como está representado: 1 0
podendo 1 ser maior ou menor a 0.
Critério estatístico empregando o Teste “t” : este é um teste designificância para verificar se a média de um conjunto de dados se diferedo valor verdadeiro (valor referência).
Teste t (Student)
Comparação entre uma média experimental e um valor conhecido:
Exemplo: Em um método para determinar ferro por absorção atômica osseguintes valores foram encontrados para um material de referência contendo38,9% de ferro: 38,9; 37,4 e 37,1%. Há alguma evidência de erro sistemático?
nstX .
)23%9,38%964,0
%8,37
Nn
sx
98,1964,039,388,37
t
t
snxt
Para 2 graus de liberdade, o valor crítico de t é 4,3 (p=0,05).
No exemplo o valor t é menor, a hipótese nula é mantida, não háevidência de erro sistemático.
Comparação das médias de duas amostras.
Verificar se existe diferença significativa entre a média experimental de umanova metodologia e a média experimental de uma metodologia referência
Exemplo: Numa comparação entre dois métodos para a determinação de boro em amostras de plantas, os seguintes resultados foram obtidos em µg/mL:
Método espectrofotométrico: média 28,0; desvio padrão = 0,3; n = 10Método fluorimétrico: média = 26,25; desvio padrão = 0,23 ; n = 10
2
11
21
222
2112
nn
snsns
21
21
11nn
s
xxt
Existem 18 graus de liberdade, assim, da Tabela de t (P=0,05), o valor crítico é 2,1.
Como o valor experimental de t é maior do que este valor, a diferença entre os dois resultados é significante no nível de 5% e a hipótese nula é rejeitada.
267,0
0715,021010
23,01103,0110 222
s
s
7,14
101
101267,0
25,260,28
t
t
Teste F para comparar conjuntos de dados.
Utilizado:
Para determinar se uma população apresenta maior variabilidadeque a outra.
Para determinar se dois métodos diferem em precisão,
Se qual entre dois analistas ou instrumentos de laboratório émais preciso dentro de um nível de confiança desejado.
2
2
B
Ac s
sF
2As = Variância do conjunto de dados A
2Bs = Variância do conjunto de dados B
Valores críticos de F para teste mono caudal (ao nível de 5 % = p =0,05)GL 1/2 1 2 3 4 5 6 7 8 9 10 12 15 20
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77
11 4,84 3,98 2,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,23
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12
1: nº de graus de liberdade no numerador; 2: nº de graus de liberdade no denominador.
Valor de F tabelado levando em consideração o número de graus de liberdade e o de significância (mono-caudal).
Valor de F tabelado levando em consideração o número de graus de liberdade e o de significância (bi-caudal).
Exemplo: um analista realizou analises de potássio em solução de concentraçãoconhecida durante vários dias. No primeiro dia para um conjunto de setedeterminações encontrou um desvio de 2,5 mg L-1, e no sétimo dia encontrou umdesvio de 3,3 mg L-1 (para dez replicatas). Existe alguma diferença nas determinaçõesdo analista ao nível de confiança de 95%?
Nnumerador = 9 (10-1); Ndenominador = 6 (7-1); Ftabelado = 5,523 (95%, p=0,05)
74,15,23,3
2
2
21
2º7
6,9 s
sF
O valor de F calculado (1,74) é menor do que F tabelado (4,10), dessaforma não houve diferença significativa no nível de 95% de confiançaentre os dois conjunto de dados, assim é aceita a igualdade dasvariâncias.
Exemplo: O valor aceito para o teor de zinco de uma amostra padrão obtida de umaanálise prévia é de 54,20 mg kg-1 (m/m) com desvio-padrão de 0,15 mg kg-1 (N = 5).Cinco análise da mesma amostra foram realizadas por um novo procedimentoinstrumental, obtendo-se os seguintes valores: 54,01; 54,24; 54,05; 54,27; 54,11 mg kg-1.O novo método produziu resultados consistentes com o valor aceito?
56,10144,00225,0
12,015,0
2
2
4,4 F
116,0
4054,0
1
2
Nxx
s i
O valor de Ftabelado para 4 Graus de Liberdade (N) no numerador epara 4 no denominador é igual a 9,6.
Assim, os desvios-padrão não são significativamente diferentes,pois Fcalculado Ftabelado e o novo método instrumental proporcionamos mesmos resultados do que o método de referência.
Teste-t pareado
Dois métodos de análises diferentes podem ter que ser comparados pelo estudode amostras contendo quantidades diferentes da espécie-teste (analito)
dd s
nxt
A Tabela mostra concentrações de manganês (mg kg-1) determinadas por dois
métodos diferentes para cada uma das quatro amostras:
Amostra Via Seca Via Húmida A 71 76 B 61 68 C 50 48 D 60 57
Os dois métodos dão valores médios de manganês que variam significantemente?
O teste de comparação das duas médias não pode ser aplicado neste caso, porque qualquer variação devida ao método seria disfarçada pelo efeito da diferença entre as porções-teste.
A melhor maneira de concluir se existe diferença estatística significativa entre as duas amostra é analisando a diferença entre cada par de resultados, um de cada método.
Adotando a hipótese nula de que não há diferença entre as médias deconcentrações pelos dois métodos, podemos testar se as diferenças sãosignificativamente diferentes de zero.
dd s
nxt 70,099,4475,1 t
Para os pares de valores acima, as diferenças são -5, -7, 2 e 3. A diferença média , é -1,75 e o desvio padrão para a diferença, , é 4,99. Como a equação para calcular t se torna:
d ds 0d
• O valor crítico de é 3,18 (P = 0,05) e como o valor calculado de émenor que isto, a hipótese nula é mantida.
• O método não deu diferença significativa para os valores médios daconcentração de manganês.
Alguns exemplos para aplicação do teste t pareado:
a quantidade de qualquer uma das espécies-teste ésuficiente para uma única determinação por método. os métodos serão comparados usando uma grandevariedade de amostras de diferentes fontes comdiferentes concentrações. as espécies-testes podem ser de um longo intervalode tempo e é necessário remover os efeitos sazonais
(temperatura, pressão, etc.)
0 1 2 3 4 5 60
1
2
3
4
5
6Y = 0,17508 + 0,89466 * Xr = 0,9504 (N = 803)
ICP
OE
S- S
-SO
4-2 (g
.kg-1
)
Turbidimetria - S-SO4-2 (g.kg-1)
Paired t-Test on Data1 col(Turbidimetr) and col(ICPOES):
Data Mean Variance N------------------------------------------------------------Turbidimetr 1,56715 0,87316 803ICPOES 1,57714 0,77368 803------------------------------------------------------------t = -0,97371p = 0,33049
At the 0,05 level, the two means are NOT significantly different.
TESTE ESTATÍSTICO PAR REJEIÇÃO DE RESULTADOS DISCREPANTES (OULTLIER)
Para saber se um resultado discrepante ou suspeito deve ou não serrejeitado para o cálculo do valor médio de um conjunto de dadosexperimentais, deve-se aplicar um teste estatístico. Existem váriosprocedimentos, sendo os mais utilizados:
teste de Dixon (teste Q); teste de Grubbs, teste Hampel e teste Cochran.
Teste de Dixon ou teste de confiança Q
O teste Q verifica:
Se um resultado pertence à mesma distribuição dos outros resultadoscomparando com os valores tabelados a 5% e 1% de significância.
Aplicação do teste Q:
Os resultados são ordenados em ordem crescente, indicando o número deZ que corresponde a cada determinação; 1, 2, 3, ... até o valor maior quecorresponde à determinação chamada de H, o valor anterior ao H é o H-1.
H = 3 até 7 determinações:
Extremo inferior Extremo superior
)1()()1()2(
ZHZZZQ
)1()(
)1()(ZHZHZHZQ
H = 8 até 12 determinações
)1()1()1()2(
ZHZZZQ
)2()()1()(
ZHZHZHZQ
H = 13 ou mais determinações
)1()2()1()3(
ZHZZZQ
)3()(
)2()(ZHZHZHZQ
TESTE Q
HValores críticos
95% (p = 0,05) 99% (p = 0,01)
3 0,970 0,994
4 0,829 0,926
5 0,710 0,821
6 0,628 0,740
7 0,569 0,608
8 0,608 0,717
9 0,564 0,672
10 0,530 0,635
11 0,502 0,605
12 0,479 0,579
13 0,611 0,697
14 0,586 0,670
15 0,565 0,647
16 0,546 0,627
17 0,529 0,610
18 0,514 0,594
19 0,501 0,580
20 0,489 0,567
Tabela com os valores críticos para o teste de Dixon – teste Q
Exemplos: Um analista obteve os seguintes resultados nadeterminação de amônia numa solução de concentração conhecida:29,4– 29,8– 30,8- 29,3– 31,3– 30,8 – 31,8.
As oito determinações são provenientes da mesma distribuição normal?
29,3 29,4 29,8 30,0 30,8 30,8 31,3 31,8
Z= 1 2 3 4 5 6 7 8 ou H
Z(H) = 31,8; Z(H-1) = 31,3; Z(2) = 29,4
208,04,25,0
4,298,313,318,31
)2()()1()(
ZHZHZHZQS
Cálculo para os valores superiores:
Cálculo para os valores inferiores:
05,00,21,0
3,293,313,294,29
)1()1()1()2(
ZHZZZQI
O valor critico (Qc) para 95% (p = 0,05) de significância é 0,608 (tabelado)
QS = 0,208 < Qc = 0,608
O valor 31,8 pertence à mesma distribuição normal, não devendo ser rejeitado.
QI = 0,05 < Qc = 0,608
O valor 29,3 pertence à mesma distribuição normal, não devendo ser rejeitado.
Exemplos: Foi analisado Cu em uma amostra de ração. Foram realizadas dez replicas (N=10) sendo os resultados expressos em mg L-1 conforme a tabela abaixo. Determinar quais resultados requerem rejeição.
Cobre (mg/L)15,42 15,51 15,52 15,53 15,68 15,52 15,56 15,53 15,54 15,5615,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68
Z 1 2 3 4 5 6 7 8 9 H=10
Z(H) = 15,68; Z(H-1) =15,56; Z(1) = 15,42; Z(2) = 15,51
643,0
14,009,0
42,1556,1542,1551,15
IQ 706,0
17,012,0
51,1568,1556,1568,15
SQ
QI = 0,643 QC = 0,530 (p = 0,05) O valor 15,42 não pertence à mesma distribuição normal, devendo ser rejeitado.
QS = 0,706 QC = 0,530 (p = 0,05) O valor 15,68 não pertence à mesma distribuição normal, devendo ser rejeitado.
Z(H) = 15,56; Z(H-1) =15,56; Z(1) = 15,51; Z(2) = 15,52
00,0
0,001,0
56,1556,1551,1552,15
IQ 00,0
04,00,0
52,1556,1556,1556,15
SQ
QI = 0,00 QC = 0,608 (p = 0,05)
QS = 0,00 < QC = 0,608 (p = 0,05)
Nenhum dos valores devem ser rejeitados
Cobre (mg/L)15,42 15,51 15,52 15,53 15,68 15,52 15,56 15,53 15,54 15,5615,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68
Z 1 2 3 4 5 6 7 8 9 H=10
Z * 1 2 3 4 5 6 7 H=8 *
X X
Teste de Grubbs (http://www.graphpad.com/quickcalcs/Grubbs1.cfm)
O teste de Grubbs (G) é realizado por meio da razão entre a diferença de cada resultados ( ix ) com a média de todos os resultados ( x ) em relação ao desvio padrão ( s ). Um valor é considerado como “outlier” quando o valor de “G” é maior que o valor crítico (GCRITICO) correspondente valores tabelado (GRUBBS, 1969). O teste é realizado no nível de significância de 95 % e repetido até não serem detectados outros “outliers
s
xxG i
N Critical Z N Critical Z3 1.15 27 2.864 1.48 28 2.885 1.71 29 2.896 1.89 30 2.917 2.02 31 2.928 2.13 32 2.949 2.21 33 2.95
10 2.29 34 2.9711 2.34 35 2.9812 2.41 36 2.9913 2.46 37 3.0014 2.51 38 3.0115 2.55 39 3.0316 2.59 40 3.0417 2.62 50 3.1318 2.65 60 3.2019 2.68 70 3.2620 2.71 80 3.3121 2.73 90 3.3522 2.76 100 3.3823 2.78 110 3.4224 2.80 120 3.4425 2.82 130 3.4726 2.84 140 3.49
TABELA TESTE DE GRUBBS
Exemplo: Para o mesmo conjunto de dados do exemplo anterior, calcular ovalor de G.
ix xxi 2xxi Gcalculado
29,3 -1,1 1,21 -1,206 29,4 -1 1 -1,096 29,8 -0,6 0,36 -0,658 30,0 -0,4 0,16 -0,439 30,8 0,4 0,16 0,439 30,8 0,4 0,16 0,439 31,3 0,9 0,81 0,987 31,8 1,4 1,96 1,536
2,243x 82,52xxi
4,30x
536,1912,0
4,308,318
G
912,0
782,5
1
2
n
xxs i
206,1912,0
4,303,291
sxxG i
Gcalculado= 1,536 Gtabelado= 2,13
n = 8; Nível de significância: 95%
Teste de Hampel
O teste de Hampel é considerado método robusto para detectar resultados considerados “outliers”. Inicialmente, é calculado o residual individual ( ir ) por meio da diferença do resultado do laboratório ( ix ) em relação à mediana ( Med ) de todos os resultados.
A seguir os valores obtidos dos ir , são ordenados em ordem crescente (sem considerar o sinal), sendo então encontrado o valor residual mediano ( medr ).
O valor é considerado um “outlier” quando o ir for maior do que 06,5medr ,
considerando nível de significância de 95 % (LINSINGER, et al, 1998).
Xxr ii X Mediana
irResidual absoluto
rm = residual medianori ≥ rm x 5,06OUTLIERse
ix ir *ir
29,3 -1,1 0,4 29,4 -1,0 0,4 29,8 -0,6 0,4 30 -0,4 0,6
30,8 0,4 0,9 30,8 0,4 1,0 31,3 0,9 1,1 31,8 1,4 1,4
Med =30,4 medr = 0,75
06,5medr = 3,795
= residual individual ordenado em ordem crescente e semconsiderar o sinal.
*ir
Exemplo Teste de Hampel: Para o mesmo conjunto de dados do exemploanterior.
Cobre (mg/L)15,42 15,51 15,52 15,52 15,53 15,53 15,54 15,56 15,56 15,68
Exercício: Verificar Outlier pelos testes de Hampel e Grubbs
GRUBBS G G15,42 -1,834 1,8315,51 -0,423 0,4215,52 -0,267 0,2715,52 -0,267 0,2715,53 -0,110 0,1115,53 -0,110 0,1115,54 0,047 0,0515,56 0,361 0,3615,56 0,361 0,3615,68 2,242 2,24
Media 15,537s 0,064n 10G tabelado 2,29
ixHAMPEL
15,42 -0,11 0,1115,51 -0,02 0,0215,52 -0,01 0,0115,52 -0,01 0,0115,53 0,00 0,0015,53 0,00 0,0015,54 0,010 0,0115,56 0,03 0,0315,56 0,03 0,0315,68 0,15 0,1515,53 0,015
0,08
ixir
*ir
medr06,5medr
Med
Teste de Cochran
O teste de Cochran é usado para comparar a maior variância com as outras
variâncias de um grupo. Pode ser usado para comparar a precisão de vários
analistas ou vários métodos de análises ou vários laboratórios.
p
ii
máx
s
sC
1
2
2
2máxs = maior variância
p
iis
1
2= a soma de todas as variâncias
p = número de laboratórios, analista ou métodos
n = número de determinações realizadas por cada analista
TABELA VALOR CRÍTICO TESTE DE COCHRAN (95%)p n=2 n=3 n=4 n=52 - 0,975 0,939 0,9063 0,967 0,871 0,798 0,7464 0,906 0,768 0,684 0,6265 0,841 0,684 0,598 0,5446 0,781 0,616 0,532 0,487 0,727 0,561 0,48 0,4318 0,68 0,516 0,438 0,3919 0,638 0,478 0,403 0,35810 0,602 0,445 0,373 0,33111 0,57 0,417 0,348 0,30812 0,541 0,392 0,326 0,28813 0,515 0,371 0,307 0,27114 0,492 0,352 0,291 0,25515 0,471 0,335 0,276 0,24216 0,452 0,319 0,262 0,2317 0,434 0,305 0,25 0,21918 0,418 0,293 0,24 0,20919 0,403 0,281 0,23 0,220 0,389 0,27 0,22 0,192
TABELA TESTE DE COCHRAN
Quatro analistas analisaram uma solução de hidróxido de sódio deconcentração conhecida e encontraram os seguintes resultados:
Exemplo Teste de Cochran
Analista Determinações (%)
1 6 10,20 0,1902 6 10,00 0,4863 6 10,70 0,1794 6 10,20 0,121
O analista 2 apresenta uma variabilidade excessiva, diferente dos demais?
74,0
3189,0236,0
121,0179,0486,0190,0486,0
2222
2
C
O valor critico para p = 4 e n = 6 (para 5% de significância) é igual a 0,590 (tabelado) e para1% de significância é igual a 0,676.O valor calculado (0,74) é maior que o valor tabelado, assim conclui-se que os resultadosdo analista 2 são menos precisos do que os resultados dos outros analistas.
Numa mesma amostra de ração foi analisado o teor de fósforo, com aparticipação de 5 laboratórios diferentes; os resultados obtidos estão na tabelaabaixo. Através do teste de Cochran verificar a homogeneidade das variânciasdos laboratórios:
Laboratório P-PO4 (g/kg) Média s2
1 32,6 31,9 33,0 32,5 0,3100
2 23,7 22,0 22,7 22,8 0,7300
3 24,6 24,6 23,6 24,3 0,3333
4 30,5 30,3 31,5 30,8 0,4133
5 23,0 24,0 24,8 23,9 0,8133
3168,0]8133,04133,03333,07300,03100,0[
8133,0
C
p
ii
máx
s
sC
1
2
2
p = 5 e n = 3
Valor critico para 5% de significância: 0,684
Valor critico para 1% de significância: 0,788
O valor calculado (0,3168) é menor que o valor tabelado, assim conclui-se que o valorcalculado é menos variável, isto é, mais preciso. Não deve ser rejeitada a variância doLAB. 5.
Controle de Qualidade
CIQ CEQ
Objetivo: manter as condições de validação no laboratório por longo tempo
CIQ
Repetições de análises
Uso de materiais de referência
Uso de cartas controle
CEQObjetivo: assegurar a comparabilidade dos resultados entre laboratórios
Participação em Ensaios de Proficiência(programas interlaboratoriais)