introduÇÃo À anÁlise de dados nas medidas de … · medidas apresentam um valor mais elevado e...

22
Física Laboratorial Ano Lectivo 2003/04 Departamento de Física da FCTUC 1/22 INTRODUÇÃO À ANÁLISE DE DADOS NAS MEDIDAS DE GRANDEZAS FÍSICAS 1. Introdução .................................................................................................................. 2 2. Erros de observação: erros sistemáticos e erros fortuitos ou acidentais ................... 2 3. Precisão e rigor ......................................................................................................... 4 4. Erro absoluto e erro relativo ...................................................................................... 4 5. Estimativa do verdadeiro valor de uma grandeza e da confiança no resultado ......... 5 5.1 Caso de uma só medição da grandeza ............................................................... 6 5.1.1 Leitura de escalas. Intervalo de imprecisão. Limite superior do erro....... 6 5.1.2 Algarismos significativos ......................................................................... 6 5.2 Caso de muitas medições da grandeza................................................................ 8 5.2.1 Distribuição de resultados ........................................................................ 8 5.2.2 Estimativa do verdadeiro valor. Média Aritmética...................................................... 10 5.2.3 Estimativa do intervalo de imprecisão. Desvio padrão dos resultados e da média ....................................................................................... 11 6. Grandezas de medição directa e indirecta. Combinação de erros ........................... 14 7. Ajuste de uma função a dados experimentais.......................................................... 16 7.1 Representação gráfica dos pontos experimentais e “barras de erro” ................ 17 7.2 Ajuste de uma curva ........................................................................................ 18 7.3 Ajuste de rectas por método analítico .............................................................. 20 7.3.1 Ajuste de uma recta da forma kx y = aos pontos experimentais ................... 20 7.3.2 Ajuste de uma recta da forma b ax y + = aos pontos experimentais ............. 21 8. Avaliação da qualidade do ajuste de uma função aos dados experimentais. Teste do qui-quadrado ............................................................................................ 22 Bibliografia .................................................................................................................. 22 Notas baseadas nos apontamentos “Análise de Dados” do Prof. Dr. Nuno Ayres de Campos

Upload: dangkien

Post on 21-Nov-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 1/22

INTRODUÇÃO À ANÁLISE DE DADOS

NAS MEDIDAS DE GRANDEZAS FÍSICAS

1. Introdução..................................................................................................................2

2. Erros de observação: erros sistemáticos e erros fortuitos ou acidentais ...................2

3. Precisão e rigor .........................................................................................................4

4. Erro absoluto e erro relativo ......................................................................................4

5. Estimativa do verdadeiro valor de uma grandeza e da confiança no resultado.........5

5.1 Caso de uma só medição da grandeza ...............................................................6

5.1.1 Leitura de escalas. Intervalo de imprecisão. Limite superior do erro.......6

5.1.2 Algarismos significativos .........................................................................6

5.2 Caso de muitas medições da grandeza................................................................8

5.2.1 Distribuição de resultados ........................................................................8

5.2.2 Estimativa do verdadeiro valor. Média Aritmética......................................................10

5.2.3 Estimativa do intervalo de imprecisão. Desvio padrão

dos resultados e da média .......................................................................................11

6. Grandezas de medição directa e indirecta. Combinação de erros ...........................14

7. Ajuste de uma função a dados experimentais..........................................................16

7.1 Representação gráfica dos pontos experimentais e “barras de erro”................17

7.2 Ajuste de uma curva ........................................................................................18

7.3 Ajuste de rectas por método analítico ..............................................................20

7.3.1 Ajuste de uma recta da forma kxy = aos pontos experimentais...................20

7.3.2 Ajuste de uma recta da forma baxy += aos pontos experimentais.............21

8. Avaliação da qualidade do ajuste de uma função aos dados experimentais.

Teste do qui-quadrado ............................................................................................22

Bibliografia..................................................................................................................22

Notas baseadas nos apontamentos “Análise de Dados”

do Prof. Dr. Nuno Ayres de Campos

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 2/22

1. INTRODUÇÃO

É um facto de observação corrente que, se repetirmos a medição de uma grandeza física em

condições supostamente idênticas, não obteremos sempre o mesmo resultado mas sim um conjunto

de valores diferentes uns dos outros. Cada um destes valores constitui um valor medido da referida

grandeza mas só por um acaso algum deles corresponderia ao seu verdadeiro valor. De facto, as

medições realizam-se sempre com imprecisões, quer devido a limitações da aparelhagem, quer

devido, por vezes, ao próprio experimentador. Como exemplo de limitações da aparelhagem, temos

o caso de um medidor digital que, por construção, leia 12,567 quando o valor da grandeza se

encontra entre 12,5671 e 12,5679, truncando, simplesmente o último dígito. O contributo do

experimentador para a imprecisão da medida acontece quando, por exemplo, os seus reflexos

intervêm na utilização de cronómetros manuais para a leitura de intervalos de tempo. Os valores

medidos são, assim, aproximações do valor verdadeiro.

Ao realizar uma medição não basta indicar o número que se obteve como resultado: é necessário

fazê-lo acompanhar de uma outra informação que indique em que medida o experimentador tem

confiança no valor que apresenta. Por exemplo, ao medir-se a distância focal f de uma lente, o

resultado final pode ser apresentado como f = 256 ± 2 mm. Significa isto que, dadas as condições

em que foi efectuada a medição, o experimentador considera que há uma probabilidade elevada (ou

a certeza, consoante as condições da estimativa deste intervalo) de o verdadeiro valor da distância

focal estar compreendido entre 254 mm e 258 mm, sendo 256 mm o valor mais provável. A este

intervalo chamaremos mais adiante intervalo de imprecisão (ou limite superior do erro, no caso da

certeza).

Os alunos de Física Laboratorial realizam trabalhos práticos visando obter resultados

experimentais. Necessitam, por isso, forçosamente, de ter algumas noções sobre análise de dados

para trabalharem e interpretarem correctamente os resultados obtidos.

2. ERROS DE OBSERVAÇÃO: ERROS SISTEMÁTICOS E ERROS FORTUITOS OU ACIDENTAIS

A preocupação fundamental do experimentador que realiza uma medição é, naturalmente, a de

tomar todas as precauções para reduzir os erros durante a experiência. Apesar disso, todas as

medições são afectadas por um erro experimental devido às inevitáveis limitações dos aparelhos de

medida ou àquelas impostas pelos nossos sentidos (visão, audição, etc.) que registam a informação.

Representemos por x o verdadeiro valor de uma grandeza que, não sendo possível conhecer,

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 3/22

postulamos no entanto existir. Ao fazer uma medição não obtenho o verdadeiro valor x, como regra.

O valor obtido x0 difere geralmente daquele. Chamamos erro de observação e muitas vezes

simplesmente erro à diferença entre ambos:

xxx −= 0δ

δx não é conhecido por não haver maneira de determinarmos o valor verdadeiro de x. Contudo, há

casos em que podemos estimar um limite superior para o valor do erro δx.

Os erros (de observação) são de duas naturezas: erros sistemáticos e erros fortuitos ou

acidentais.

Suponhamos que medimos o período de um pêndulo com o auxílio de um cronómetro e que

repetimos várias vezes a medição. Os atrasos ou antecipações do experimentador ao ligar e desligar

o cronómetro e os erros na estimativa das divisões da escala provocam variações nos resultados das

sucessivas medições e podem ser considerados erros acidentais. As pequenas irregularidades no

movimento dum pêndulo real, como por exemplo um desalinhamento em relação ao plano do

movimento, podem também contribuir para os erros acidentais, apesar de não serem provocados

pelas limitações dos aparelhos de medida. Se não se manifestarem outros erros, algumas das

medidas apresentam um valor mais elevado e outras um valor mais baixo, dispersas em torno dum

valor médio.

Por outro lado, se além disso o cronómetro tiver, por exemplo, tendência para se atrasar, todos os

resultados virão reduzidos dum valor constante. Ao contrário, as forças de atrito podem ser

suficientes para aumentar visivelmente dum valor constante os resultados da medição dos tempos.

Trata-se assim de erros sistemáticos. Relativamente aos erros sistemáticos, muitas vezes difíceis de

detectar, não existe qualquer teoria generalizada que permita o seu estudo. No entanto, e ao

contrário dos erros acidentais, são, na maior parte dos casos, susceptíveis de correcção, podendo

mesmo ser eliminados. De facto, os cuidados do experimentador, o perfeito conhecimento das

condições em que realiza a experiência e do método que está a seguir, uma permanente

desconfiança dos aparelhos de medida e, sobretudo, uma larga prática, permitem compensar ou

evitar este tipo de erros.

Os erros acidentais, dado o carácter aleatório com que se apresentam, podem ser submetidos a

um tratamento matemático baseado na Teoria das Probabilidades. É deles que nos ocuparemos nos

parágrafos que se seguem.

Interessa salientar, porém, que a fronteira entre erros sistemáticos e erros acidentais não é, por

vezes, bem definida e que, se há erros que facilmente podemos identificar como sistemáticos, outros

existem que, estando ligados a incertezas difíceis de esclarecer, tornam impraticável distinguir se

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 4/22

pertencem a uma ou a outra destas categorias.

3. PRECISÃO E RIGOR

Convém também distinguir os conceitos de precisão e de rigor numa medida. Diremos que uma

medição é feita com grande precisão se os erros acidentais são pequenos quando comparados com o

valor da grandeza medida; diremos que uma medição é feita com rigor (ou exactidão) se os erros

sistemáticos são pequenos.

O termo precisão é usado para caracterizar a reprodutibilidade dos resultados, indicando a

dispersão em torno do valor médio; exactidão é o termo que se utiliza para exprimir o afastamento

do valor médio relativamente ao verdadeiro valor da grandeza. A precisão é tanto maior quanto

menor for a dispersão das medidas em torno do valor médio; a exactidão é tanto maior quanto mais

próximo do verdadeiro valor estiver o valor médio, no limite dum número de medidas infinito. A

precisão pode ser aumentada reduzindo os erros acidentais; a exactidão pode ser aumentada

corrigindo os erros sistemáticos.

4. ERRO ABSOLUTO E ERRO RELATIVO

Note-se ainda que um erro, seja ele de que tipo for, pode ser expresso de duas maneiras

diferentes: o “erro absoluto” ou o “erro relativo”.

Chamamos erro absoluto de um resultado medido ou calculado à diferença, já apresentada

anteriormente, entre esse resultado e o valor verdadeiro da grandeza. Se designarmos por x0 o

referido resultado e por x o valor verdadeiro da grandeza, o erro absoluto será:

xxx −= 0δ .

Chamamos erro relativo ao valor do quociente entre o erro absoluto e o valor verdadeiro da

grandeza:

xx

xxx δ=

−0 .

Analisando dimensionalmente as equações anteriores verifica-se que o erro absoluto se exprime

nas unidades da grandeza, enquanto o erro relativo é uma grandeza adimensional. Estas duas formas

de exprimir um erro distinguem-se ainda pela natureza das informações que fornecem.

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 5/22

Note-se agora o seguinte: não sendo possível conhecer o verdadeiro valor de uma grandeza x, é

possível fazer uma estimativa a partir de um conjunto de medidas. Assim, embora não se possa

conhecer o verdadeiro valor x, podemos trabalhar com a noção de erro absoluto δx para cada uma

das medidas realizadas. Por outro lado, como duma medida realizada obtivemos um valor x0,

podemos usar a noção de erro relativo calculando 0xxδ .

Considere-se o exemplo seguinte: um resultado de 2505 kg/cm2 na leitura de uma pressão cujo

valor verdadeiro é 2500 kg/cm2 representa um erro absoluto de 5 kg/cm2; se a pressão a medir for

20 kg/cm2 e o resultado da medida tiver sido 25 kg/cm2, o erro absoluto será novamente de

5 kg/cm2. Pelo contrário, os erros relativos cometidos em cada um dos casos serão, respectivamente,

002.02500

5= e 25.0

205= . Ou seja, enquanto o erro absoluto é independente do maior ou menor

valor da grandeza a medir, o erro relativo é largamente dependente desse valor, revelando a

precisão da medida feita: um erro de 2 cm na medida de uma distância de 200 m representa uma boa

precisão, enquanto o mesmo erro de 2 cm na medida de uma distância de 10 cm revela uma fraca

precisão.

O erro relativo exprime-se, por vezes, em termos de percentagem e define, então, a chamada

percentagem de erro ou erro percentual. No último exemplo apresentado, os erros relativos

percentuais seriam, respectivamente

%01.010020000

2=x e %20100

102

=x .

5. ESTIMATIVA DO VERDADEIRO VALOR DE UMA GRANDEZA E DA CONFIANÇA NO RESULTADO

O propósito de qualquer medida ou conjunto de medidas de uma grandeza é o conhecimento do

seu verdadeiro valor. Na impossibilidade de o atingir temos, como já foi dito atrás, de fazer a nossa

melhor estimativa desse verdadeiro valor, ou seja, obter o nosso “melhor verdadeiro valor”. Por

outro lado, temos também de estimar um intervalo de valores que corresponda à confiança que

temos no melhor verdadeiro valor, ou seja, estimar a imprecisão do resultado. Nos parágrafos

seguintes tratamos dos métodos de fazer estas estimativas.

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 6/22

5.1 Caso de uma só medição da grandeza

Nos casos em que só é possível realizar uma medida única de uma grandeza, a melhor estimativa

que temos para o verdadeiro valor da grandeza é o próprio resultado obtido na medida. No entanto,

não deixamos por isso de necessitar de apresentar informação sobre a confiança que temos nesse

resultado, ou seja sobre o erro com que apresentamos o resultado.

5.1.1 Leitura de escalas. Intervalo de imprecisão. Limite superior do erro.

Quando se trata da leitura da escala de um aparelho (uma régua, um voltímetro digital, o

écran de um osciloscópio, por exemplo), é costume tomar-se como imprecisão na medida metade

da menor divisão da escala. Admite-se então que o verdadeiro valor da grandeza (x, por

exemplo) se encontra no intervalo [x-∆x, x+∆x], onde ∆x é metade da menor divisão da escala em

causa. Neste intervalo de valores, designado por intervalo de imprecisão, temos a certeza de estar

o verdadeiro valor da grandeza, sendo por isso ∆x chamado limite superior do erro.

Se as menores divisões da escala forem tão afastadas que facilmente se divide o seu

intervalo em 4 partes, pode tomar-se a imprecisão como ¼ da menor divisão da escala. De modo

contrário, se as divisões forem tão pequenas que seja difícil ler metade da menor divisão deve

tomar-se como limite superior do erro a menor divisão da escala.

Assim, por exemplo, se estivermos a medir um dado comprimento com uma régua graduada

em milímetros (a menor divisão é de 1 mm) e o valor do comprimento estiver situado entre 14.1

cm e 14.2 cm, diremos, sendo razoável tomar como imprecisão metade da menor divisão da

escala (0.5 mm), que o verdadeiro valor do comprimento está entre 14.05 cm e 14.15 cm ou, de

modo condensado, que o comprimento é de 14.10 ± 0.05 cm.

5.1.2 Algarismos significativos

Suponhamos o caso de um voltímetro digital que permite leituras da tensão até à milésima de

volt. Então, o voltímetro dá pouca informação sobre décimos milésimos de volt, embora dê alguma.

Se o verdadeiro valor da tensão for, por exemplo, 23.5647 V, o voltímetro indicará 23.565

(admitindo que ele está construído para fornecer o valor mais próximo da sua escala, ao que se

chama “arredondar para o valor mais próximo”). Se o verdadeiro valor fosse antes, por hipótese,

23.5654 V ele marcaria de novo 23.565. Em resumo, a indicação 23.565 corresponde a um valor

compreendido entre 23.5645 e 23.5655.

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 7/22

Esta situação é muito comum e convencionou-se que, em alternativa a escrever explicitamente o

intervalo de imprecisão como atrás (23.5650 ± 0.0005), o último algarismo indica que o verdadeiro

valor está num intervalo de amplitude igual à unidade dessa ordem e centrado no valor dado, ou

seja, corresponde ao valor ± meia unidade da ordem seguinte. O limite superior do erro é esta meia

unidade da ordem seguinte. Apresenta-se o resultado da medição como sendo 23.565 em que os

algarismos tomam o nome de “algarismos significativos”. O último algarismo tem um significado

especial, como se viu no exemplo do voltímetro, pois indica qual a incerteza no valor medido. Pode,

por isso, ser um zero. Por exemplo, utilizando esta convenção 7.4200 tem 5 algarismos

significativos e indica que o verdadeiro valor está entre 7.41995 e 7.42005. Se o resultado é

expresso por um número sem parte decimal, escreve-se em notação científica e usa-se a convenção

acima. Exemplo: 670000 com 3 algarismos significativos escreve-se 6.70x105.

Ao efectuar operações com números nesta convenção, devem também adoptar-se algumas regras

para apresentação dos resultados. Vamos ilustrar com exemplos.

Seja o primeiro multiplicar 5.74 por 3.8 em que estes valores obedecem à convenção dos

algarismos significativos. O produto dá 21.812 mas como o primeiro factor indica um valor

qualquer compreendido entre 5.735 e 5.745 e o segundo um valor entre 3.75 e 3.85, só podemos

afirmar que o produto estará entre:

5.735 x 3.75 = 21.50625 e 5.745 x 3.85 = 22.11825.

Se quisermos representar o produto dentro da convenção dos algarismos significativos devemos

adoptar apenas o número 22. Evidentemente que, ao proceder assim, estamos a afirmar que o valor

está entre 21.5 e 22.5 o que, sendo verdade, alarga porém a imprecisão. A vantagem está na

simplificação que advém da adopção neste caso de uma regra simples como a que se segue:

Multiplicação, divisão e raiz quadrada: o número total de algarismos significativos do resultado é o

número total de algarismos significativos do factor que tiver menor número deles.

Ex: 56.25 x 5.37 = 302.0625 mas como 5.37 tem 3 algarismos significativos há que arredondar o

resultado para 302.

Adição e subtracção: o número de casas decimais significativas do resultado é o da parcela que tiver

menor número delas.

Ex: 4.17 + 1.6 = 5.77 mas como 1.6 tem 1 casa decimal significativa há que arredondar o resultado

para 5.8.

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 8/22

5.2 Caso de muitas medições da grandeza.

Sabemos já que, em virtude dos erros acidentais, se repetirmos a medição de uma mesma

grandeza física em condições supostas idênticas obtemos um conjunto de resultados diferentes. No

entanto, se não houver erros de procedimento experimental, cada medida contribui com o seu

resultado para aumentar a informação sobre o verdadeiro valor, aumentando ainda em consequência

a precisão do resultado final obtido a partir do conjunto de resultados.

5.2.1 Distribuição de resultados

Um processo gráfico para exprimir os diferentes resultados obtidos consiste em desenhar um

histograma.

Para construir um histograma procede-se do seguinte modo:

1. Marcam-se no eixo das abcissas os valores máximo e mínimo das leituras obtidas;

2. Divide-se o intervalo assim obtido num número conveniente de sub-intervalos iguais;

3. Tendo por base cada um desses sub-intervalos constroem-se rectângulos cujas alturas sejam

proporcionais ao número de leituras de valor compreendido em cada sub-intervalo.

Suponhamos que um determinado comprimento é medido 30 vezes. Os sucessivos resultados

obtidos, x1, x2, ..., x30, estão representadas na Tabela I. Os valores mínimo e máximo desses

resultados são respectivamente,

99.2 e 113.0 mm.

Pode, assim, traçar-se o histograma para o intervalo [99, 113]. Dividindo este intervalo em, por

exemplo, sete sub-intervalos, pode estabelecer-se a Tabela II.

Tabela I

x1 = 105.2 mm

x2 = 103.6 mm

x3 = 110.3 mm

x4 = 102.0 mm

x5 = 101.5 mm

x6 = 109.4 mm

x7 = 103.6 mm

x8 = 99.2 mm

x9 = 108.0 mm

x10 = 107.6 mm

x11 = 109.3 mm

x12 = 105.9 mm

x13 = 103.9 mm

x14 = 104.0 mm

x15 = 110.8 mm

x16 = 113.0 mm

x17 = 108.2 mm

x18 = 102.4 mm

x19 = 104.3 mm

x20 = 109.3 mm

x21 = 107.3mm

x22 = 106.6mm

x23 = 105.3mm

x24 = 105.8mm

x25 = 104.5mm

x26 = 106.3mm

x27 = 106.1mm

x28 = 103.2mm

x29 = 106.9mm

x30 = 106.6mm

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 9/22

Tabela II

Intervalos Nº de leituras em cada intervalo

99-101

101-103

103-105

105-107

107-109

109-111

111-113

1

3

7

9

4

5

1

O histograma correspondente a estes resultados vem representado na fig.1.

98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 1140

2

4

6

8

Nº d

e le

itura

s em

cad

a in

terv

alo

Comprimento/cm Figura 1

Imaginemos agora que continuávamos a fazer medições até obter um número de resultados N

muito elevado. O histograma desta colecção hipotética de resultados tende, quando N →∞ , a

tomar uma forma estável, que se designa por distribuição. O conjunto dos N resultados constitui

uma amostra da distribuição. Se o número N for efectivamente muito elevado, podemos escolher

intervalos com largura muito pequena e ter ainda um número apreciável de resultados em cada

intervalo. Se considerarmos que a grandeza pode tomar qualquer valor real dentro do seu domínio

(ou seja, é uma variável contínua), podemos considerar intervalos com largura infinitamente

pequena dx, e a linha poligonal correspondente ao contorno do histograma tende para uma curva

contínua. (fig. 2). Cada ponto da curva representa o número de resultados que caem em cada

intervalo infinitesimal (x, x+ dx).

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 10/22

Figura 2

Podemos definir a função f(x), conhecida por função de distribuição, em que (após conveniente

norma1ização, 1dx)x(f =∫+∞

∞−), f(x)dx representa a fracção dos resultados que se situa no intervalo

de x a x+dx. Por outras palavras, f(x)dx é a probabi1idade de que o resultado duma única medida se

situe no intervalo (x, x + dx).

Quando estas curvas são simétricas relativamente a uma recta paralela ao eixo das ordenadas e

que passa pelo seu máximo a média da distribuição coincide com o valor mais provável da

grandeza. A distribuição normal ou de Gauss é um exemplo de uma distribuição simétrica aplicável

a um vasto universo de situações em Física.

5.2.2. Estimativa do verdadeiro valor. Média aritmética.

Suponhamos que fazemos N medições sucessivas de uma mesma grandeza física e que estas

medições foram efectuadas sem que se verificasse qualquer erro sistemático ou de procedimento

experimental. Sejam x1, x2, ..., xN os resultados obtidos. A melhor estimativa do verdadeiro valor da

grandeza é dada pela média aritmética das leituras obtidas, ou seja, por:

( )N

x

Nx...xx

x

N

1ii

N21∑==

+++= . (1)

Admite-se que quanto maior o número de medidas realizadas mais o valor da média aritmética se

aproxima do verdadeiro valor da grandeza. A média aritmética tende para o verdadeiro valor no

f(x)

x

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 11/22

limite de ∞→N .

Por vezes não atribuímos igual confiança (ou peso) a todas as medidas realizadas. Isso não

significa que se devam desprezar as medidas de menor confiança pois elas contribuem também com

informação válida sobre o verdadeiro valor. Então, há que extrair o valor mais aproximado do

verdadeiro valor a partir de um conjunto de medidas não atribuindo a todas o mesmo peso. A média

pesada de um conjunto de N resultados xi, cada um com peso ωi é:

=

== N

1ii

N

1iii x

ω. (2)

O peso ωi pode surgir em duas situações:

1ª: Se nas N medidas se obtiverem vários resultados com o mesmo valor xi, o peso é

simplesmente o número de medidas ni com esse resultado.

2ª: Se as diferentes medidas foram feitas com instrumentos diferentes ou em condições

experimentais diferentes, é natural que as dispersões de resultados com cada instrumento ou cada

situação experimental (se fizéssemos muitas medidas em cada um) fossem diferentes umas das

outras, ou seja, os intervalos de imprecisão σi são diferentes. Pressupõe-se naturalmente que se

conhecem ou podem ser estimados estes intervalos de imprecisão. Neste caso, embora se aproveite

toda a informação sobre o verdadeiro valor presente em cada resultado xi, vamos dar mais peso

àqueles para os quais a confiança é maior, ou seja, para os que têm um σi menor, segundo a

expressão:

=

== N

i i

N

i i

ix

x

1

1

σ (3)

5.2.3 Estimativa do intervalo de imprecisão. Desvio padrão dos resultados e da média.

Resta esclarecer qual o erro que se comete ao tomar a média aritmética como a melhor estimativa

do valor verdadeiro [1]. Este erro deve estar correlacionado com a dispersão de resultados. Por

[1] Repare-se que quantas mais vezes se repetir uma medida tanto maior é a probabilidade de reduzir os efeitos dos erros acidentais ao considerar a média aritmética dos valores obtidos. Porém, por mais medidas que se façam não se consegue aumentar o número de algarismos significativos de cada resultado. No entanto, se conhecermos a forma da distribuição de probabilidades (p.ex. Gaussiana) e tivermos um mínimo de valores possíveis para o resultado (barras no histograma de dispersão – quatro para a Gaussiana), continuamos na situação de aproximação da média ao valor verdadeiro no limite de um número infinito de medidas.

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 12/22

outro lado, uma vez que a média tende para o verdadeiro valor no limite de um número infinito de

medidas, esse erro deve ser definido também em função do número de medidas.

Adoptando a média aritmética como a melhor estimativa do verdadeiro valor, a noção de erro de

observação de uma dada medida individual vem agora substituída pela de “desvio” ou “resíduo” de

cada resultado do conjunto de medidas.

Seja x o valor verdadeiro da quantidade a medir e que evidentemente desconhecemos. O erro

absoluto δxi na leitura de ordem i é

xxx ii −=δ .

Do mesmo modo, o erro xδ na média aritmética será

xxx −=δ .

Porém, estas duas expressões pressupõem o conhecimento do valor verdadeiro x. Para tornear essa

dificuldade trabalhamos em termos de “desvios” ou “resíduos”. O desvio da leitura i é definido por

xxd ii −= ,

quantidade que é já possível calcular.

Admitindo que se realizam N medidas experimentais da mesma grandeza, cada resultado obtido

apresenta um certo desvio (afastamento) relativamente ao valor médio calculado. Precisamos, então,

de um parâmetro que caracterize a dispersão das N medidas efectuadas. Um critério imediato

pareceria ser o de adoptar a simples média dos desvios, mas não pode ser utilizado pois dá sempre

zero. Com efeito:

( ) 0xxxN1x

N1xx

N1d

N

1i

N

1ii

N

1ii =−=−=−= ∑∑∑

===

.

Este resultado é devido, evidentemente, às definições correlacionadas de média e desvio,

conduzindo a que haja desvios positivos e negativos cuja soma é nula. Isto sugere que, em vez dos

desvios, usemos os seus módulos ou os seus quadrados, por exemplo.

O desvio padrão dos resultados σN é a média quadrática dos desvios, ou seja, é a raiz quadrada

do valor médio dos quadrados dos desvios:

∑=

=N

iiN d

N 1

21σ . (4)

A variância dos resultados é o valor médio dos quadrados dos desvios. É, portanto, o quadrado do

desvio padrão dos resultados:

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 13/22

∑=

=N

iiN d

N 1

22 1σ . (5)

Utilizam-se, também, o desvio padrão relativo ou o desvio padrão percentual:

xN

Nr

σσ = (6) ou 100x

xN%

σ = (7),

respectivamente.

O desvio padrão dos resultados σN não é ainda, no entanto, o melhor estimador da dispersão dos

resultados. Reparemos que na sua definição entramos com todos os N resultados para definir a

média, reduzindo assim em 1 o número de variáveis independentes. Não faz sentido, por outro lado,

definir um desvio padrão com N = 1. Utiliza-se então para estimador da dispersão de resultados o

chamado desvio padrão ajustado:

∑=−

=N

iiN d

Ns

1

2

11 (8)

Para um número de medidas muito grande, os dois algoritmos dão resultados muito aproximados.

Há ainda que notar que, assim como a média tende para o valor verdadeiro da grandeza quando N

tende para infinito, também este sN tende para o desvio padrão da distribuição de probabilidades

subjacente às limitações do sistema e condições de medida.

Desvio padrão e variância da média - A própria média é uma variável aleatória que está também

sujeita a uma distribuição de probabilidade cuja variância, 2mσ , será tanto menor quanto maior for o

número N de determinações. Pensemos que se fizermos várias amostras de N medidas cada, não

vamos obter sempre a mesma média, e ainda que a dispersão destas médias se vai tornando cada vez

menor à medida que aumentarmos o número N de medidas, sendo mesmo nula no limite de N

infinito. Definimos assim o desvio padrão da média σm, cujo estimador é de novo um desvio padrão

ajustado:

Ns

s Nm = . (9)

O intervalo msx ± é adoptado como intervalo de imprecisão da estimativa ( x ) que se fez do

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 14/22

verdadeiro valor, sendo ms designado por erro mais provável. Note-se mais uma vez que este erro

é nulo quando N é infinito, ou seja, a média tende para o verdadeiro valor. Se considerarmos uma

distribuição Gaussiana para as médias resulta que o verdadeiro valor da grandeza tem uma

probabilidade de 68% de estar contido neste intervalo.

6. GRANDEZAS DE MEDIÇÃO DIRECTA E INDIRECTA. COMBINAÇÃO DE ERROS

Muitas vezes a medida de uma grandeza não pode ser realizada directamente e o seu valor tem

de ser calculado a partir da medida directa de outras grandezas com as quais se relaciona. Neste

caso, como as medidas realizadas directamente virão necessariamente afectadas por um erro

experimental, a questão que se coloca é saber como podemos estimar a imprecisão que afecta a

grandeza calculada a partir da imprecisão associada às medidas experimentais. Por exemplo,

poderemos medir a densidade d do material que constitui uma peça paralelipipédica medindo a sua

massa M e as dimensões a, b, e c da peça. A relação funcional entre a quantidade que pretendemos,

d, e as quantidades primárias M, a, b, e c é expressa por

c.b.aMd = .

Como as quantidades primárias são inevitavelmente medidas com um certo erro, interessa-nos

esclarecer de que maneira esses erros individuais se propagam ao resultado d.

Generalizando, designemos por Z a quantidade final e por A, B, C, etc. as quantidades primárias.

Suponhamos que cada uma destas quantidades primárias foi medida várias vezes. Então, no caso de

A teremos o valor mais provável A e o respectivo desvio padrão Aσ . Do mesmo modo teremos B

e o desvio padrão Bσ , e assim sucessivamente. Partimos do princípio de que as medidas das

quantidades primárias são independentes e, portanto, que os erros nelas cometidos são também

independentes. Seja então a função

Z = Z (A, B, C, ...)

e sejam Aσ , Bσ , etc. os desvios padrão em A , B , etc., respectivamente. Demonstra-se que o erro

em Z, Zσ , é dado pela expressão (fórmula de propagação dos erros):

( ) ...22

2 +

∂∂

+

∂∂

= BAZ BZ

AZ

σσσ (10)

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 15/22

Apresenta-se a seguir uma tabela que indica as expressões de Z para algumas das relações mais

comuns entre Z e A, B, etc.:

Função Relação entre erros

Somas e Diferenças ...BAZ...BAZ

+−=++=

( ) ( ) ( ) ...222 ++= BAZ σσσ

Produto e quociente B/AZ

B.AZ==

222

+

=

BAZBAZ σσσ

Potências

mn xBAZ =

22

22

2

+

=

Bm

An

ZBAZ σσσ

Exemplo: Dada uma função BAZ 2−= , onde A e B são medidas independentes, pretende-se

calcular a valor de Z e do seu erro Zσ a partir dos seguintes valores médios de A e de B:

m 245 ;m 3100 ±=±= BA

Resolução:

O cálculo de Z é imediato: basta considerar que BAZ 2−= e então m 10452100 =−= xZ .

Para calcular Zσ , recorremos à expressão geral,

( ) ...22

2 +

∂∂

+

∂∂

= BAZ BZ

AZ

σσσ ,

e como 1=∂∂

AZ e 2−=

∂∂BZ

vem 5=Zσ .

O resultado final será pois

m 510±=Z .

Este resultado presta-se a algumas considerações. Verificamos assim que, embora os valores das

quantidades A e B estejam afectados de um desvio padrão relativamente baixo (< 5%), o mesmo não

acontece com o resultado final, onde o erro é quase tão elevado como o próprio valor de Z (o erro

relativo é de 50%!). Este exemplo indica que, se pretendermos que a imprecisão no resultado final

não exceda um valor prefixado temos de, utilizando a fórmula de propagação dos erros, determinar

quais os limites superiores do erro a admitir em cada uma das quantidades primárias. O processo de

medida duma (ou mais) dessas quantidades poderá ser crucial para que o erro final possa estar

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 16/22

dentro dos limites pretendidos.

7. AJUSTE DE UMA FUNÇÃO A DADOS EXPERIMENTAIS

Um problema geral da Física no estudo de um dado fenómeno é identificar as grandezas em jogo

e descobrir relações analíticas entre elas. Quando o faz diz que “explica” o fenómeno.

Concretizemos num exemplo propositadamente simples, para fixar ideias. Suponhamos que o

fenómeno é a passagem da corrente num condutor filiforme e as grandezas identificadas são por

exemplo a tensão aos seus extremos e a corrente que o atravessa. (Notar que a descrição do

fenómeno está deliberadamente estilizada, pois poderíamos fazer entrar como grandezas envolvidas

a temperatura do condutor, as dimensões, as propriedades elásticas, etc... .)

A 1ª questão que se põe ao físico é discernir qual o tipo de variação. Será do tipo linear, parabólico,

sinusoidal?...

No exemplo em causa, Ohm propôs uma dependência linear do tipo aIV = em que a é um

parâmetro a determinar experimentalmente. Àquele parâmetro empírico chamou-se resistência R e

foi possível, como se sabe, relacioná-lo com características geométricas e físicas do material

condutor:

slRa ρ==

em que ρ é um parâmetro a determinar experimentalmente.

De uma forma geral tenta-se descobrir o tipo de variação com base em várias considerações,

algumas de ordem física, outras por analogias com outros fenómenos, muitas vezes

semiempiricamente por simples análise dos resultados experimentais (teoria da correlação), que

mais tarde se procura interpretar. Como exemplo, recordar a fórmula empírica proposta por

Rydberg para a determinação das riscas do espectro do hidrogénio, mais tarde explicada por Bohr a

partir do seu modelo do átomo.

A 2ª questão é determinar quanto valem os parâmetros característicos do tipo de variação proposto

Ainda no exemplo em causa, para um dado condutor há que medir experimentalmente um certo

número de pares de valores das grandezas correlacionadas (Vi, Ii) e utilizar um critério para a

determinação do melhor verdadeiro valor para R. Veremos adiante como proceder por via analítica

para casos simples de variação linear como este.

A 3ª questão é formular um juízo de valor sobre as opções anteriores

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 17/22

Por exemplo, a variação linear da tensão com a intensidade da corrente não se verifica senão em

primeira aproximação. Depende, por exemplo, do aquecimento do condutor que por sua vez é

função da corrente (Lei de Joule). É por isso quase sempre necessário limitar a gama de valores das

grandezas para as quais as relações propostas são válidas, e com que aproximação elas são válidas.

Veremos que há critérios para testar quantitativamente a “qualidade” das opções escolhidas.

7.1 Representação gráfica dos pontos experimentais e “barras de erro”

Exemplifiquemos com um caso simples de um conjunto de 7 pontos experimentais representando

os resultados de 7 pares de medidas de duas grandezas correlacionadas y e x. Admitamos que os

erros na medição de x são desprezáveis em relação aos erros na medição de y.

Na figura 3 estão marcados os pontos

experimentais correspondentes a cada par

(xi, yi), e representados os desvios padrão

σi das medidas yi, sob a forma de

segmentos verticais (chamadas barras de

erro) centrados nos pontos experimentais

e de comprimento 2σi. Esta representação

define completamente e de uma forma

compacta a gaussiana de distribuição de

cada um dos resultados yi, significando

que há um probabilidade de 68% do

verdadeiro valor da grandeza y estar

dentro do intervalo definido pela barra de erro, para o correspondente valor xi da grandeza x.

Nota 1 – Na figura admitiu-se que os desvios padrão dos diferentes valores yi eram todos iguais.

Não tem de ser forçosamente assim. Na medição do valor da grandeza y correspondente a um dado

valor da grandeza x as condições experimentais não são forçosamente as mesmas do que para outro

valor.

Nota 2 – Há ainda casos em que a distribuição de probabilidade dos valores de y não é gaussiana e

outras vezes nem sequer é simétrica, pelo que as barras de erro não são simétricas em relação ao

ponto representado, não se lhe atribuindo exactamente o mesmo significado que o indicado acima.

7.2 Ajuste de uma curva

Figura 3

0 1 2 3 4 5 6 710

12

14

16

18

20

22

24

26

recta

Y

X

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 18/22

Para esclarecer ideias procuremos, após analisarmos a figura, responder às questões formuladas

atrás, ou seja, estimar uma correlação entre os valores de x e os valores correspondentes de y, isto é

uma função da forma y = f(x) que pareça descrever da melhor maneira a dependência que y tem de

x. Vamos fazê-lo a sentimento para ilustrar o princípio do processo.

Tentando responder à primeira questão formulada tentou-se primeiro uma recta passando pela

origem. Com o cuidado de maximizar a proximidade da recta do conjunto de todos os pontos

experimentais desenhou-se a recta da Fig. 3 a que corresponde uma determinada expressão

matemática. Fez-se o que se chama uma tentativa de ajustamento ou ajuste de uma curva teórica

(neste caso uma recta) a dados experimentais, ou seja, respondeu-se à segunda questão formulada

atrás.

Seguindo para a terceira questão, por simples inspecção da figura é-se levado a opinar que o

ajuste de uma recta é mau. O grande afastamento da recta em relação ao extremo das barras de erro

para tantos pontos leva a crer que a probabilidade de ter obtido aquele conjunto de resultados dum

modo aleatório seria muito baixa se a correlação real fosse de facto uma recta.

Volta-se então de novo a formular a

primeira questão, tentando-se agora

uma parábola, e pode ver-se (Fig. 4)

que o ajuste de uma parábola é bastante

melhor, pois a curva já se aproxima ou

mesmo intersecta um número razoável

de barras de erro, fazendo supor uma

probabilidade elevada para o conjunto

de resultados.

O processo de, após adopção de um

tipo de curva, obter a curva que melhor

se ajusta deve evidentemente ser de

forma analítica, sistemática, e não a

sentimento. Trataremos disso em

seguida para o caso das rectas. A ideia de qualidade do ajustamento necessita evidentemente de ser

quantificada e por isso trataremos no capítulo seguinte de um dos critérios mais usados para

caracterizar numericamente a qualidade do ajustamento (teste do qui-quadrado), determinando um

número de mérito para cada ajuste.

Recapitulando e generalizando, o problema do ajuste de curvas surge habitualmente de duas

0 1 2 3 4 5 6 710

12

14

16

18

20

22

24

26

parábolaY

X

Figura 4

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 19/22

maneiras:

1) – No primeiro caso está em estudo uma grandeza y que se supõe dependente de várias outras

y = f(x, u, v, z...) mas desconhece-se esse tipo de relação funcional e trata-se de induzir

empiricamente essa relação a partir da análise sistemática de um conjunto de medidas de x,

u, v, z, etc. e do correspondente valor de y.

2) Noutro caso constrói-se uma teoria a partir da qual se tenta prever qual a referida

dependência.

Quase nunca se está em posição de propor a expressão analítica de y mas sim o tipo de relação

analítica, isto é, se se trata de uma recta, de uma parábola ou outra curva qualquer, desconhecendo-

se em geral “ab initio” o valor dos parâmetros que contenha, os quais devem ser determinados a

partir dos dados experimentais. No caso de uma recta que passe pela origem, há um só parâmetro

desconhecido.

Proposta uma dependência funcional y = f(x, u, v, z..., a, b, c, ...) em que a, b, c, ... são os

parâmetros, há portanto que determinar o melhor conjunto de valores desses parâmetros para que os

valores

y = f(xi, ui, vi, zi... a, b, c, …)

(os muitas vezes chamados valores “teóricos”, que advêm para y por intermédio da função proposta

quando x, u, v, z, ... tomarem o conjunto de valores medidos xi, ui, vi, zi, ...), não se afastem

globalmente muito dos valores medidos yi correspondentes (ou como se diz muitas vezes “para que

a curva proposta se ajuste o melhor possível aos pontos experimentais”). O método que conduz à

escolha desses parâmetros decorre do princípio de máxima probabilidade, que diz (dum modo

abreviado) “Um conjunto de resultados é o mais provável”.

Em seguida é necessário verificar se essa melhor curva do tipo proposto se ajusta bem ou mal aos

pontos experimentais. Se se ajusta mal terá de se propor um novo tipo de curva.

7.3 Ajuste de rectas por método analítico

Estudaremos as variações do tipo kxy = e do tipo baxy += . Nestes casos é possível obter

fórmulas para os melhores valores dos parâmetros e respectivos intervalos de imprecisão, deduzidas

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 20/22

de uma vez para sempre a partir do princípio de máxima probabilidade. Algumas calculadoras de

bolso já contém os algoritmos respectivos pelo que basta fornecer-lhes os pares de valores (xi, yi)

para que indiquem os melhores valores para os parâmetros k ou a e b e seus desvios padrão.

Tratamos aqui dos casos em que se desprezam os erros nas medidas de x e em que se consideram os

erros nas medidas de y todos iguais a σy.

7.3.1 Ajuste de uma recta da forma kxy = aos pontos experimentais

Admita-se que a relação entre as grandezas x e y é da forma kxy = . Se as medidas não viessem

afectadas de erro bastaria achar um par de valores (x1, y1) para se obter logo 1

1

xyk = . Na realidade,

os valores medidos têm erros e torna-se necessário melhorar a precisão aumentando a informação

disponível mediante mais medições de pares (x, y). O melhor verdadeiro valor para o parâmetro k é

dado pela expressão, aplicável a todos os casos enquadráveis nas aproximações descritas:

=

== N

ii

N

iii

x

yxk

1

2

1 (11)

Admitindo que o erro associado a todos os yi é o mesmo, como se referiu, o desvio padrão das

medidas yi é

( )∑=

−=N

iii kxy

N 1

21σ (12)

e o erro mais provável associado ao parâmetro k é

∑=

ii

yk x 2

2σσ . (13)

7.3.2 Ajuste de uma recta da forma baxy += aos pontos experimentais

De novo por aplicação do princípio de máxima probabilidade, obtêm-se expressões para os

melhores valores verdadeiros dos parâmetros a e b, válidas para qualquer caso enquadrado nas

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 21/22

aproximações descritas:

22

=

∑∑

∑∑∑

ii

ii

ii

ii

iii

xxN

yxyxNa (14)

22

2

=

∑∑

∑∑∑∑

ii

ii

ii

iii

ii

ii

xxN

xyxxyb . (15)

Neste caso, o desvio padrão dos valores de y é dado por:

( )[ ]∑=

+−=N

ii baxy

N 1

21σ . (16)

E o desvio padrão dos parâmetros a e b vem dado por:

2ya

Nσσ

∆= (17)

∆=∑

ii

b

x 2

σ , (18)

onde 2

2

=∆ ∑∑

ii

ii xxN

8. AVALIAÇÃO DA QUALIDADE DO AJUSTE DE UMA FUNÇÃO AOS DADOS EXPERIMENTAIS. TESTE DO

QUI-QUADRADO

Trata-se de arranjar um número cujo valor permita estabelecer juízos padronizados sobre a

qualidade do ajustamento da recta, ou de qualquer outra função, aos dados experimentais. Esse

número denomina-se “qui-quadrado”, χ2, e é dado por:

Física Laboratorial Ano Lectivo 2003/04

Departamento de Física da FCTUC 22/22

[ ]∑=

−=

N

i i

ii yxy1

2

22 )(

σχ , (19)

onde y(xi) são os valores de y obtidos a partir do ajuste da recta y = ax + b aos N pares de valores

(xi, yi) e σi são os desvios padrão nos valores medidos yi.

No entanto, um dado valor de χ2, por si só, não indica se se trata de um bom ou mau ajuste. Esta

indicação é fornecida pelo qui-quadrado normalizado, 2nχ , ou seja, pelo quociente entre o χ2 e o nº

de graus de liberdade ν:

νχ

χ2

2 =n , com 1−−= rNν , em que N é o número de pares de valores experimentais e r é o

número de parâmetros a ajustar. No caso da recta há 1 (k) ou 2 (a e b) parâmetros a ajustar.

Um bom ajuste caracteriza-se por um valor de 2nχ muito próximo de 1. Quanto mais 2

nχ se afaste de

1, pior será a qualidade do ajuste.

Bibliografia

- N. Ayres de Campos, Análise de Dados, Coimbra, Departamento de Física da Universidade

(2003/04).

- P.R. Bevington e D.K. Robinson, Data reduction and error analysis for the physical sciences, 2ª

edição, WCB/McGraw-Hill (1992).