estatÍstica aplicada à metrologiadf.ffclrp.usp.br/cidra/wp-content/uploads/2016/07/slides... ·...

41
ESTATÍSTICA Aplicada à METROLOGIA José Carlos BORGES Supervisor de Radioproteção da Fundação Hemocentro de Ribeirão Preto - FUNDHERP Diretor de P&D do Centro de Ensaios e Pesquisa em Metrologia - METROBRAS Professor aposentado do Depto. de Engenharia Nuclear da COPPE - UFRJ Áreas de atuação : Radioproteção - Metrologia das Radiações

Upload: duongthuy

Post on 09-Nov-2018

243 views

Category:

Documents


0 download

TRANSCRIPT

ESTATÍSTICA Aplicada à METROLOGIA

José Carlos BORGES

Supervisor de Radioproteção da Fundação Hemocentro de Ribeirão Preto - FUNDHERP

Diretor de P&D do Centro de Ensaios e Pesquisa em Metrologia - METROBRAS

Professor aposentado do Depto. de Engenharia Nuclear da COPPE - UFRJ

Áreas de atuação : Radioproteção - Metrologia das Radiações

Estatística

• A necessidade de se estudar estatística decorre da

natureza ALEATÓRIA do FENÔMENO e da MEDIÇÃO .

Isto requer que os dados obtidos sejam objeto de :

• Análise dos dados ,

• interpretação do resultado da medição

que darão respaldo à :

• tomada de decisão.

Quando medimos algum

mensurando ( PROPRIEDADE de um fenômeno ),

temos em mente realizar alguma coisa com o resultado da

medida, ainda que seja tão somente comunicar o resultado.

Ocorre que os resultados da medição ( CONJUNTO de medidas )

estão quase sempre afetados por erros , que podemos chamar

de equívoco, distração ou fraude mas, também,

erros intrínsecos, que não podem ser eliminados,

por mais que nos esforcemos, mas que podem ser reduzidos .

Para tanto , precisam ser : estudados e compreendidos.

EXEMPLO

Medir a espessura de placas de aço ( controlar sua qualidade durante a fabricação ) parece, a priori, uma

operação que, se feita com cuidado e com um bom instrumento, levará a um resultado que

não poderá ser posto em dúvida.

Entretanto , como é impossível determinarmos o valor real da espessura da placa , o melhor que podemos

fazer é medirmos a espessura com uma qualidadeexcelente , tão grande que qualquer esforço para melhora-la seja desnecessário ou inadequado ,

tendo em vista o que se pretende fazer coma placa.

Como não podemos evitar completamente os erros de medição , devemos aprender a conviver com eles.

Por que sempre haverá erros ?

Entre outras razões , porque

a espessura pode depender de :

Temperatura - pressão - umidade do ambiente ;

local medido na placa ( espessura não uniforme ) ;

características limitadoras do instrumento utilizado

( estabilidade , resolução , etc. )

Outro problema é a disponibilidade dos objetos medidos.

Nem sempre temos acesso a todos os elementos que compõem

o que chamamos de população - objeto de estudo.

GERALMENTE , PODEMOS / TEMOS QUE

estudar - medir apenas uma porção da população ,

chamada amostra

Exemplo : pesquisa eleitoral para prefeito

População : todos os eleitores da cidade ( 50.000 )

Amostra : 2.000 eleitores da cidade

RAZÕES - NECESSIDADES para se realizar medições :

→ controlar a qualidade de um produto ,

→ planejar atividades,

→ determinar causas e efeitos,

→ aprimorar processos, para conhecer o comportamento de sistemas.

Para que os resultados da medição sejam corretos / adequados

permitindo que tomemos decisões acertadas / otimizadas,

necessitamos de ferramentas estatísticas padronizadas

que transformem dados qualitativos ou quantitativos em

resultados válidos suficientemente exatos e com incertezas aceitáveis .

ESTATÍSTICA

Conjunto de ferramentas ( instruções) padronizadas para

Escolher amostras - Planejar medidas

Processar e apresentar dados na forma de

tabelas, gráficos, etc. ( estatística descritiva )

Cujos resultados nos forneçam as características da amostra,

que nos permitam deduzir

as propriedade da população ( inferência estatística )

TIPOS DE DADOS ESTATÍSTICOS

As ferramentas estatísticas aplicam-se não somente a dados

quantitativos ( valores numéricos ), mas também a :

dados qualitativos

dados semi-quantitativos

Exemplo :

verificar a natureza dos dados ( variáveis ),

estabelecer uma classificação para cada tipo e

nomear suas características.

Um laboratório de calibração de dectetores tem alguns

equipamentos na prateleira, prontos para serem retirados por

seus usuários.

05 detetores tipo Geiger,

04 câmaras de ionização,

06 contadores proporcionais e

03 detectores de cintilação de estado sólido.

Alguns desses aparelhos já passaram por calibração anteriormente :

03 estão sendo calibrados pela primeira vez,

09 já foram calibrados 1 vez antes e

07 já foram calibrados 3 vezes.

Os equipamentos estão em sete faixas de preço:

02 na categoria A , 06 na B , 01 na C , 03 na categoria D , 03 na E , 03 na F e 01 na categoria G

sendo A os mais baratos e G os mais caros.

Na forma de tabela, esses dados ficam mais fáceis de serem analisados :

Tabela 1 - Tipo de aparelho Tabela 2 - No. De calibrações

Tabela 3 - Faixa de preço

Tipo de aparelhoNo. de detect.

No. de calibrações

No. de aparelhos

Faixa de preço

No. de aparelhos

Detector geiger 5 1 3 A 2

Câmara ionização 4 2 9 B 6

Contadorproporcional

7 3 7 C 1

Detector cintilação 3 D 3

E 3

F 3

G 1

Que tipos de dados estatísticos ( variáveis estatísticas )

estão sendo apresentados nessas tabelas ?

Vamos começar com a 2a tabela

Os números da segunda coluna são as

frequências de cada categoria da 1a coluna:

Dados da tabela 2

Variável: número de calibrações

Valores da variável : 1 , 2 e 3

Freqüências de cada valor : 3 , 9 e 7.

Na 1ª tabela, o dado estatístico é ‘tipo de detector’

na 2ª é ‘ número de calibrações ’ e

na 3ª é ‘ faixa de preço ’.

Os números que aparecem na frente

de cada tipo de detector da tabela 1

são as freqüências de cada tipo.

Examinando a 1a tabela.

Dados da tabela 1 :

Variável : tipo de detector.

Valores da variável : detector Geiger ,

câmara de ionização , contador proporcional ,

cintilador.

Frequências de cada valor : 5 , 4 , 7 e 3 .

No caso da tabela 2 , os valores da variável são números.

No caso da tabela 1 , os valores são palavras.

Isso faz diferença? Sim !

Os dados qualitativos da tabela 1 são chamados

‘ dados nominais ’

e os dados quantitativos da tabela 2 são chamados

‘ dados intervalares ’

e o tratamento que se pode/deve dar a cada tipo é diferente.

Dados da tabela 3

Variável : faixa de preço.

Valores da variável : A, B, C, D, E, F e G

Freqüências de cada valor: 2, 6, 1, 3, 3, 3 e 1

Examinando a Tabela 3

Neste caso, as variáveis são letras

MAS a ordem dos valores é pré-definida.

Cada letra corresponde a uma faixa de preço

maior que a da letra precedente.

A esse tipo de variáveis damos o nome de

“ dados ordinais “

0

1

2

3

4

5

6

7

8

1 2 3 4

Histograma de Frequência : Tipo de Detector

1. Geiger Muller 2 Câmara de Ionização 3 Contador Proporcional 4 . Detector de Cintilação

Exemplos de tipos de dados estatísticos

Tipo de dados Exemplos de variáveis Valores possíveis

Dados nominais sexo feminino; masculino; Indefinido

estado civil solteiro; casado; divorciado

tipo sanguíneo A ; B ; AB ; O

tipo de emissão radioativa Alfa, gama, raio X, nêutron, pósitron

Dados ordinais classe social A; B; C; D; E etc.

escolaridade 1o; 2o; 3o

classe de radiotoxicidadeda Tabela V (3.01)

I; II; III; IV; V

Dados intervalares peso 1,5 ; 7,38 ; 40 ; 50 ; 250 ( qualquer número )

altura 1,57 ; 1,75 ; 7,2 ; 8500 ( qualquer número )

energia da radiação 5,7 ; 370 ; 660 ; 1,17 ( qualquer número )

tensão de operação 600 ; 800 ; 400 ; 550 ( qualquer número )

Exemplo

Resultado de um ensaio de espectrometria gama:

O número de fótons de cada energia ( eixo x ) que é contado pelo detector ( eixo y ).

VARIÁVEL

FREQÜÊNCIA

Figura 1 – Espectro gama do Cobalto-57.

DETERMINAÇÃO DE ERROS EXPERIMENTAIS

Quando um cientista/analista/operador faz uma medição, em geral,

assume que exista um ‘valor verdadeiro’ daquilo que está medindo.

Quando relata o resultado, em geral, o que faz é especificar uma

faixa de valores

dentro da qual espera que o valor verdadeiro esteja.

A forma usual de especificar esta faixa de valores é:

Valor Medido = melhor estimativa do valor ± incerteza

Avaliar esta incerteza é o objetivo da determinação de erros experimentais.

Devemos ter conhecimento das fontes de erros na medição

e de quanto eles afetam o resultado. Isto implica:

Identificar as fontes de erro

Eliminar os erros que puderem ser evitados

Quantificar os erros inevitáveis

Padronizar os efeitos desses erros por meio do

registro da incerteza nos resultados da medição

Os erros que podem e devem ser controlados são chamados

de erros sistemáticos . Os erros que não podem ser

controlados são chamados de erros aleatórios

ERROS SISTEMÁTICOS

Os erros sistemáticos estão relacionados com

o uso de equipamentos descalibrados ,

aplicação de procedimentos inadequados ou

emprego dos modelos, subjacentes ao processo de medição,

conceitualmente errados.

A ) Falta de calibração

O elemento mais crítico de qualquer processo de medição é a

relação entre uma medida e o padrão da unidade de medida ,

ou seja, a calibração do instrumento.

A calibração é a comparação entre a indicação do

instrumento e o valor do padrão mantido por um laboratório

de referência para as unidades das respectivas grandezas.

Tabela 5 - Exemplo de grandezas e suas unidades de medida

grandeza unidade do SI outros sistemas

comprimento metro polegada , milha

massa quilograma arroba , onça

atividade becquerel curie

exposiçãocoulomb por quilograma

röentgen

FONTE

DE

RADIA

ÇÃO

FONTE

DE

RADIA

ÇÃO

DETETO

R

CALIBR

ADO

DETETOR

DESCALIB

RADO

Erro ou falta de calibração do instrumento de medida.

Tanto a régua quanto o detetor indicarão , sistematicamente,

valores diferentes dos verdadeiros .

A régua mostrada na figura sempre vai

subestimar o comprimento verdadeiro.

O detetor vai sempre superestimar a intensidade da radiação.

B ) Equívoco / Engano

Falhas nos procedimentos de medição são as fontes de erro

mais sujeitas ao controle do experimentador ( quem faz a medida ).

PADRÃO DE COMPRIMENTO

OBJETO

RÉGUA CALIBRADA, PORÉM MAL

USADA101 105

1 105

Erros do operador

FONTE DE

RADIAÇÃ

O

FONTE DE

RADIAÇÃ

O

DETETOR

CALIBRADO

DETETOR

CALIBRADO EM

POSIÇÃO ERRADA

C ) Erro conceitual

O modelo conceitual equivocado é uma fonte de erro sistemático

que , frequentemente , passa desapercebida.

Exemplo de erro sistemático , importante na área radiológica :

utilizar um instrumento inadequado para medir diferentes tipos de radiação.

ERROS ALEATÓRIOS

São causados por variações incontroláveis nos instrumentos de medida,

acarretando a não repetição dos valores

observados em medidas consecutivas

Mesmo instrumentos muito BONS exibem pequenas variações aleatórias.

Essas variações são descritas por dois termos : precisão e repetibilidade

que podem ser usados como sinônimos de estabilidade.

Tabela 6 - Valores das contagens dos fótons provenientes de uma fonte que foram detectados por um detector Geiger

Medida 1a 2 a 3 a 4 a 5 a 6 a 7 a 8 a 9 a 10 a

Resultado 21 26 35 30 24 28 31 30 29 38

EXATIDÃO E PRECISÃO

Os dois tipos de erros descritos são distinguidos e expressos pelas

exatidão e precisão das medidas.

TIROS PRECISOS

E INEXATOS

TIROS PRECISOS

E EXATOS

TIROS IMPRECISOS

E EXATOS

TIROS IMPRECISOS

E INEXATOS

Exemplo

Observe o gráfico abaixo .

No eixo x , estão os valores obtidos em uma série de medidas de um mesmo objeto.

No eixo y , estão as freqüências dos ( quantas vezes cada valor foi obtido ).

As medições foram feitas com quatro instrumentos diferentes.

Figura 6 - Representação gráfica de exatidão e precisão.

VALOR OBSERVADO

FR

EQ

ÜÊ

NC

IA

VALOR VERDADEIRO

A

B

C

D

QUALIDADE DOS INSTRUMENTOS

A – EXATO E PRECISO

B – EXATO E IMPRECISO

C – INEXATO E PRECISO

D – INEXATO E IMPRECISO

A curva A contém os resultados de um instrumento exato, pois os valores

obtidos estão próximos do valor verdadeiro, e preciso, pois os valores estão

pouco dispersos.

A curva B contém os resultados de um instrumento exato, pois os valores

estão próximos do valor verdadeiro, e impreciso, pois os valores estão mais

dispersos.

A curva C contém os resultados de um instrumento inexato, pois os valores

se concentram em torno de um valor distante do valor verdadeiro, porém

preciso, já que os resultados estão bem agrupados.

A curva D contém os resultados de um instrumento inexato, pois os valores

estão distantes do valor verdadeiro, e impreciso, pois os resultados estão

mais dispersos.

ALGARISMOS SIGNIFICATIVOS

Algarismo significativo é aquele ao qual está

associado um significado físico e

deve dar uma informação correta

do valor real de uma grandeza.

AVALIAÇÃO DE INCERTEZAS

Uma única medida

A incerteza em um resultado , a partir de uma única

medida, depende muito de inúmeras condições do

processo de medição mas , em geral , pode ser

estimada como sendo

metade da menor divisão da escala do instrumento.

medida de X = 4,70 cm - o 7 exato e o 0 incerto

Estimativa de X = 4,7 cm - o 7 é incerto

Exemplo de medidas com diferentes precisões

Várias medições : A incerteza de uma média de uma série de

medidas do mesmo objeto é o desvio padrão ( s ) das medidas.

s é a medida mais comum da dispersão estatística.

Ele mostra o quanto de variação ou "dispersão" existe

em relação à média ( ou valor esperado ).

Um desvio padrão pequeno indica que

os dados tendem a estar próximos da média .

Um desvio padrão alto indica que os dados estão

bastante espalhados em relação à média.

O desvio padrão é definido como a raiz quadrada positiva da variância.

É definido de maneira a dar-nos uma medida de dispersão que :

Seja um número não-negativo;

Use a mesma unidade de medida dos dados fornecidos inicialmente.

Fórmula da Variância Fórmula do Desvio Padrão

O Coeficiente de Variação é obtido pela

razão entre o desvio-padrão e a média

Indica se a dispersão é grande em relação à média.

ERRO DE / POR ARREDONDAMENTO

Arredondamento é a operação que

Elimina algarismos do número

e , portanto ,

diminuindo o número de algarismos significativos ,

aumenta o erro ( ? )

PROPAGAÇÃO DE ERROS EXPERIMENTAIS

Muitas vezes , a grandeza que se quer avaliar

não pode ser medida diretamente com um instrumento.

Para determiná-la ,

medimos outras grandezas relacionadas.

Se uma grandeza z é função de outras grandezas

x e y : z = f ( x , y )

a expressão que nos dará a incerteza s ( z ) será :

2

y

2

2

x

2

sy

zs

x

z)z(s

A expressão

x

z

significa a derivada parcial de z em relação à variável x

Exemplo : incerteza na determinação da distância percorrida por um objeto

a partir da medida da velocidade e do tempo:

Seja v = 10,1 ± 0,5 e t = 6,3 ± 0,1.

Qual a distância percorrida e a incerteza no resultado ?

D = v . t = 10,1 . 6,3 = 63,63

Arredondando para a quantidade correta

de algarismos significativos

a resposta é 64

Para estimarmos a incerteza no resultado , utilizamos a

expressão para s ( z ) e as funções derivadas :

tv

D

v

t

D

sv = 0,5 st = 0,1

33079,31,01,105,03,6svsts 22222

t

22

v

2

D