criterio chauvenet - verificação de outliers

6
O Critério de Chauvenet É comum que o experimentalista ache que alguns valores medidos em um certo experimento extrapolam a tendência dominante. Estes valores podem ser, de fato, medições erradas, como podem também representar certo fenômeno físico de interesse. Por este motivo, estes valores que fogem à tendência dominante não podem ser descartados sem recorrer a critério consistente para sua eliminação. Sejam n medições de uma grandeza, onde n é grande, de modo que os resultados seguem uma distribuição Gaussiana. Como já vimos, esta distribuição fornece a probabilidade de que um dado valor medido esteja desviado de um certo valor da média esperada. Não se pode esperar probabilidade menor que 1/n. Assim, se a probabilidade para o desvio de um certo valor medido é menor que 1/n, pode-se qualificá-lo para ser eliminado do conjunto de dados. Na realidade, testes mais restritivos são aplicados para eventualmente eliminar valores medidos. O critério de Chauvenet é um deles: especifica que um valor medido pode ser rejeitado se a probabilidade m de obter o desvio em relação à média é menor que 1/2n. A tabela 1 lista valores da razão do desvio em relação ao desvio padrão para vários valores de n conforme este critério. Tabela 1 – Critério de Chauvenet para rejeição de valor medido. Número de leituras, n Razão entre o máximo desvio aceitável e o desvio padrão, 3 1,38 4 1,54 5 1,65 6 1,73 7 1,80 10 1,96 15 2,13 25 2,33 50 2,57 100 2,81 300 3,14 500 3,29 1000 3,48

Upload: gustavo-de-miranda-saleme-gidrao

Post on 30-Sep-2015

32 views

Category:

Documents


13 download

DESCRIPTION

Verificação de Outliers

TRANSCRIPT

O critrio de Chauvenet

O Critrio de Chauvenet

comum que o experimentalista ache que alguns valores medidos em um certo experimento extrapolam a tendncia dominante. Estes valores podem ser, de fato, medies erradas, como podem tambm representar certo fenmeno fsico de interesse. Por este motivo, estes valores que fogem tendncia dominante no podem ser descartados sem recorrer a critrio consistente para sua eliminao.

Sejam n medies de uma grandeza, onde n grande, de modo que os resultados seguem uma distribuio Gaussiana. Como j vimos, esta distribuio fornece a probabilidade de que um dado valor medido esteja desviado de um certo valor da mdia esperada. No se pode esperar probabilidade menor que 1/n. Assim, se a probabilidade para o desvio de um certo valor medido menor que 1/n, pode-se qualific-lo para ser eliminado do conjunto de dados. Na realidade, testes mais restritivos so aplicados para eventualmente eliminar valores medidos. O critrio de Chauvenet um deles: especifica que um valor medido pode ser rejeitado se a probabilidade m de obter o desvio em relao mdia menor que 1/2n. A tabela 1 lista valores da razo do desvio em relao ao desvio padro para vrios valores de n conforme este critrio.

Tabela 1 Critrio de Chauvenet para rejeio de valor medido.

Nmero de leituras,

nRazo entre o mximo desvio aceitvel

e o desvio padro,

31,38

41,54

51,65

61,73

71,80

101,96

152,13

252,33

502,57

1002,81

3003,14

5003,29

10003,48

Para aplicar o critrio de Chauvenet para eliminar valores duvidosos, em primeiro lugar calcula-se o desvio mdio e o desvio padro do conjunto de dados medidos. O desvio de cada um dos pontos comparado com o desvio padro, conforme os valores da Tabela 1, para assim se eliminar os pontos duvidosos. Para a apresentao dos dados finais, um novo valor mdio e um novo desvio padro so calculados, sem incluir os pontos eliminados. O critrio poderia at ser repetido mais uma vez, para a eliminao de mais pontos, entretanto o procedimento no recomendvel, basta uma vez. Se diversos pontos extrapolarem o critrio-limite estabelecido, provvel que o sistema de instrumentao seja inadequado, ou que o processo sendo medido seja extremamente varivel.

Como j vimos, erros em medies podem ser caracterizados por uma funo normal, e o desvio padro pode ser reduzido aumentando-se o nmero de medies. Na maioria dos casos,

o custo experimental coloca um limite sobre o nmero de medies. Deve-se considerar, tambm, que o erro sistemtico presente na medio no uma varivel aleatria, e os procedimentos estatsticos podem ser efetivamente usados para condicionar dados experimentais com valores medidos erroneamente.

O critrio de Chauvenet, ento, fornece uma base consistente para tomar a tomada de deciso de excluir ou no um dado de um conjunto de valores medidos. Para sua aplicao, basta clcular a razo do desvio individual para o desvio padro, R, e comparar com um valor de referncia, R0. R0 depende do nmero de medidas, enquanto que R definida como: . O valor medido rejeitado quando R > Ro.

Exemplo de Aplicao do Critrio de Chauvenet.

As medidas a seguir so de comprimento. Calcule o valor mdio, o desvio padro, a varincia e desvio absoluto mdio. Aplicar o critrio de Chauvenet para verificar possvel inconsistncia.

Leitura12345678910

x, cm5,305,736,775,264,335,456,095,645,815,75

Soluo:

O valor mdio dado por

.

Os outros valores so computados com auxlio da tabela abaixo:

Leitura (cm) (cm2)

1-0,3139,797

20,1171,369

31,157133,865

4-0,35312,461

5-1,283164,609

6-0,1632,657

70,47722,753

80,0270,0729

90,1973,881

100,1371,877

A varincia,

cm

O desvio-padro,

cm

O desvio absoluto mdio,

cm

Calcula-se a razo

Leitura12345678910

0,4990,1871,8450,5632,0460,2600,7610,0130,3140,219

Compara-se o valor obtido com o valor de referncia na Tabela 1, 1,96 (para n = 10). Assim, pode-se eliminar somente o 5o ponto. O novo valor mdio

cm

O novos valores de desvio e desvio quadrtico esto na tabela abaixo:

Leitura

1-0,45620,7936

2-0,0260,0676

31,014102,8196

4-0,49624,602

6-0,3069,364

70,33411,156

8-0,1161,346

90,0540,292

10-0,0060,0036

Ento,

cm.

_1158671576.unknown

_1159167543.unknown

_1159168449.unknown

_1159168354.unknown

_1158671678.unknown

_1158671966.unknown

_1158672079.unknown

_1158671826.unknown

_1158670742.unknown

_1158670765.unknown

_1158670553.unknown

_1158668161.unknown