Tratamento estatístico de dados experimentais  conceitos básicos
1
2
Incerteza associada a uma medição
Propagação de erros
3
4
Representação gráfica
Pequeno guia para criar gráficos
5
Regressão linear
1
1 Incerteza associada a uma medição
Todas as medidas estão afetadas de uma incerteza porque qualquer instrumento,
por melhor que seja, tem uma escala e a expressão da medida real nessa escala
implica sempre uma aproximação a medida exata
Erro  é a diferença entre o valor medido e o “valor verdadeiro” da grandeza em análise
Incerteza  é o parâmetro associado ao resultado de uma medição de uma grandeza
física que caracteriza a dispersão de valores que podem ser atribuídos a essa grandeza
2
1.1 Um exemplo com uma régua milimétrica
Uma régua comum, graduada em milímetros
l é o comprimento do objeto
5 < l < 6 (mm)  a extremidade do objeto está entre os valores 5 mm e 6 mm
l = 6.0 0.5 (mm)
(0.5 mm é a metade da menor divisão da escala)
Significa que podemos estar a cometer um erro máximo de 0.5 mm na nossa leitura
A este valor de 0.5 mm chamamos INCERTEZA INSTRUMENTAL
3
Agora vamos imaginar que a régua é bem grande e portanto temos uma escala mais
ampliada e que por isso podemos perceber com mais clareza
• A marca mais próxima é 6
• Que o comprimento real não ultrapassa 6
As informações anteriores levam-nos a concluir que
5.5 < l < 6.0 (mm)
Portanto, a leitura deverá agora ser expressa como
l = 5.75  0.25 (mm)
Note-se que neste caso o valor medido não coincide com os valores da escala (1,2,3,4,5,6,. . . )
Os valores medidos estão desviados de um quarto da menor divisão relativamente aos valores
da escala.
4
1.2 A generalização do exemplo para a regra a seguir nas aulas
O exemplo que foi referido na secção anterior poderia ser generalizado a qualquer escala
analógica (uma escala contínua)
Regra 1: A incerteza associada a uma escala analógica corresponde a metade da sua
menor divisão
Regra 1 (extendida): A incerteza associada a uma escala analógica pode ir até um
quarto da sua menor divisão
5
1.3 Escalas digitais
E quanto as escalas digitais, como nos cronómetros ou balanças digitais?
A diferença, é que não temos acesso ao meio da escala  escala descontínua
Pensemos, por exemplo, num cronómetro digital de segundos
Imaginemos que fazemos uma cronometragem que deu 5 s
5<t<6s
Portanto poderíamos escrever como anteriormente: t = 5.50.5 s
 mas há um problema adicional nas escalas digitais!
6
A calibração do ponto zero também e afetada pela incerteza da escala digital!
incerteza total = incerteza associada a medida + a incerteza associada a calibração do zero
(metade da menor divisão da escala) +
(também metade da menor divisão da escala)
Voltando ao exemplo anterior, a leitura do tempo deverá ser então dada por
t = 5 1 s
Regra 2: A incerteza associada a uma escala digital corresponde a sua menor divisão
Regra 2 (extendida): A incerteza associada a uma escala digital pode considerar-se
como sendo metade da sua menor divisão se pudermos desprezar as incertezas
associadas a calibração do zero
7
1.4 O número de casas decimais de uma medida
Regra 3: O número de casas decimais (nCD) de uma medida deve ser igual ao
número de casas decimais da incerteza instrumental
Exemplos:
l = 3.0060  0.0005 m
8
1.5 Algarismos significativos
O número de algarismos significativos (nAS) associado a uma dada medida é igual ao
número de algarismos que têm realmente significado
 esta definição quer dizer implicitamente que nem todos os algarismos têm significado
Casos em que um algarismo não conta (não é significativo)
 Zeros a esquerda não contam:
09 = 9
 o primeiro zero é redundante e não serve para nada - não é significativo
 Zeros a direita não contam se apenas indicarem ordem de grandeza
Quando se diz que há 10 milhões de portugueses
Não quer dizer que 10000000 é o valor exato de portugueses
 este valor é apenas uma ordem de grandeza
9
Mas suponhamos que o ultimo censo dava exatamente 10000000 - nem um a mais, nem um a
menos. Como indicar que agora todos os zeros são significativos, porque derivados de uma
contagem real?
A resposta é: COLOCANDO UM PONTO DECIMAL NO FIM
(a) Zeros não significativos: 10000000 (sem ponto)
(b) Zeros significativos: 10000000. (com ponto)
Uma outra forma de justificar o ponto anterior (a) e notar que o número de portugueses se
pode escrever aproximadamente
1107
 potência de 10
O único AS é o 1
Todos os outros zeros estão condensados na potência, a que não associamos nenhum
AS
10
Regra 4: Zeros a esquerda e zeros representativos de ordem de grandeza não são
significativos. O primeiro AS conta por 2 se for 5.
11
1.6 Há relação entre o nCD e o nAS?
Se forem números em abstrato o nCD e o nAS são independentes entre si, mas para as
medições, podemos dizer que há realmente uma relação entre eles
Exemplo: Um objeto com 3.25682(. . . ) m e medido em duas réguas: uma com escala
milimétrica e outra com escala centimétrica.
 A leitura na escala milimétrica será
l = 3257.0  0.5 mm. nCD=1
Escrevendo a leitura em cm, l = 325.70  0.05 cm.
 A leitura na escala centimétrica será
l = 326.0  0.5 cm.
nAS=5
nCD=2
nAS=5
nCD=1
nAS=4
Para o mesmo objeto e medida, mudar de escala implica mudar de nAS
A escala determina o nCD 
o nCD determina o nAS
12
Exemplos:
13
1.7 Series de medidas
Tudo o que discutimos ate agora se referiu apenas a uma medida
Para certas grandezas, normalmente fazemos
uma série de medidas
Exemplo: Medição do tempo que uma esfera
leva a deslizar sobre um plano inclinado
Resultados
Os tempos não são todos iguais porque há muitos fatores não controláveis a
influenciar o resultado da medida: a sincronia da largada do corpo com o
início da contagem, o tempo de reação do operador e a própria forma como o
corpo e largado.
14
Como representaremos este conjunto de dados?
Vamos supor que fizemos mil medições do tempo, para a mesma experiência.
Fazemos um histograma destas contagens considerando:
 a classe 4.5 contém todas as repetições em que se observou t < 4.5 s
 a classe 4.6 contém todos as repetições em que se observou 4.5  t < 4.6 s
 a classe 4.7 contem todos as repetições em que se observou 4.6  t < 4:7 s
 ...
 a classe 6.4 contem todos as repetições em que se observou 6.3  t < 6.4 s
 a classe 6.5 contem todos as repetições em que se observou 6.4  t s
15
HISTOGRAMA
Frequência absoluta
250
200
150
100
50
4.5 4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6 6.1 6.2 6.3 6.4 6.5
Classe de contagem do tempo em s
A classe mais observada é a classe 5.5, que corresponde a 5.4  t < 5.5 s  com cerca
de 200 eventos observados
Depois seguem-se as classes 5.4 e 5.6  com aproximadamente 170 eventos cada
16
As classes poderiam tornar-se tão estreitas quanto quiséssemos e acabaríamos por obter
uma distribuição contínua.
17
No nosso caso a distribuição contínua, está representada a vermelho
DISTRIBUIÇÃO GAUSSIANA OU NORMAL
18
A forma do “sino” é definida pelo desvio padrão  

A distribuição Normal (ou Gaussiana ) é simétrica
em torno do ponto , e que representa a média da
distribuição

A forma matemática da distribuição Normal é dada por:
 ( x  μ) 2 
A0
N ( x | x, A0 , σ ) 
exp

2
2
σ
σ 2


N ( x | x, A0 , σ )  representa o valor da função no ponto x
A0
 é a amplitude da função
19
Dos valores observados na medição
68% no intervalo [ μ  σ , μ  σ ]
95% no intervalo
[ μ  2σ , μ  2σ ]
99.7% no intervalo [ μ  3σ , μ  3σ ]
Por isso a forma ideal de
caracterizar a medição é escrever:
x=  
20
Para um número finito de medições (10 ou mais valores)
 estimamos o valor de  através do cálculo do valor médio (x )
N
x
x
i 1
i

N é o número de medições e {x } é o conjunto das medidas
i
N
 consideramos o desvio padrão ( ) da amostra com sendo
s e que corresponde a
N
s
Escrevemos a medição na forma:
2


x

x
 i
1
N 1
x xs
21
Podemos ter duas incertezas associadas às medidas
 Para uma medida individual apresentamos o resultado na forma
x  x0  x
 x0 é o valorda escala

x é a incertezaassociada a escala
 Para uma série de medidas apresentamos o resultado na forma
x xs
 x é o valormédio das medidas

s é a incertezaestatística
Regra 5: A representação de uma serie de medidas faz-se na forma x  x  maxx, s
em que x é o valor médio da amostra * e s é o desvio padrão da amostra **, e x é a
incerteza da escala.
N
N
* x
 xi
i 1
N
** s 
2


x

x
 i
1
N 1
22
Voltando às medições do tempo de deslizamento duma esfera sobre um plano inclinado
x  5.5422 s
s  0.2513 s
x  0.01 s
A medição deve apresentar-se na forma:
t  5.54  0.25 s
Note-se que para escrever o resultado final o valor de s foi comutado para o número de casas
decimais da incerteza instrumental. Isto constitui a regra seguinte:
Regra 6: Os valores da média e desvio padrão devem ser escritos com o mesmo nCD
da incerteza instrumental. Em geral, quando se escreve uma medida na forma
valor  incerteza, o nCD do valor e da incerteza devem ser iguais.
23
2
Propagação de erros (ou propagação de incertezas)
Muitas vezes precisamos calcular uma grandeza a partir de um conjunto de medidas de
grandezas experimentais afetadas de incertezas. E depois será necessário quantificar a
incerteza da grandeza calculada
Exemplo: Quero saber a área de um retângulo, de lados a e b. Se consideramos que cada
lado do retângulo foi medido com uma régua diferente:
b
a é a incerteza de a
b é a incerteza de b
a
Qual será a incerteza A da área A=ab ?
A
Esta incerteza pode ser calculada através da fórmula de propagação de incertezas
(erros) que estudaremos a seguir
24
MÉTODO PARA UTILIZAR NAS AULAS PRÁTICAS
2.3 Cálculo da incerteza associada a uma operação sobre medidas  caso  x« x
A GRANDEZA DEPENDE DE UMA VARIÁVEL
Queremos determinar a incerteza de uma grandeza G que é função de uma outra grandeza x:
G=f(x)
A incerteza de x é x. Denominaremos de G a incerteza de G
De acordo com a expansão de Taylor podemos calcular o valor de f(x + x ) a partir do
valor de f(x), se x « x ( que é o nosso caso).
Aproximação de 1º ordem da série de Taylor:
f(x + x )= f(x)+ x f’(x)
ou
x f’(x)= G

x

dG
= G
dx
x f’(x) =f(x + x )- f(x)

G 

dG
x
dx
25
L
Exemplo 1. Cálculo da área do quadrado
A  L2  52  25 m2
nAS=2
L
Resultado da medição do lado do quadrado
L  5.0  0.5 m
L  5.0 m

L  0.5 m
Cálculo de V utilizando a expressão:
G 
dG
dA
x  A 
L
dx
dL
dL2
A  (
)L  2 LL  2  5.0  0.5  5 m 2
dL
A  25 5 m
2
26
Exemplo 2. Cálculo do volume de uma esfera a partir do valor do diâmetro.V  4  D    D3
3 2 6
3
Resultado da medição do diâmetro da esfera
 D  3.015 mm nAS=4
D  3.015  0.025 mm 
D  0.025 mm
Cálculo de V utilizando a expressão:
G 
dG
x  V  dV
D
dx G G
dD D D
V  14.35  0.36 mm3
nAS=4
27
2.4 Cálculo da incerteza associada a uma operação sobre medidas  caso de
mais do que uma variável
A GRANDEZA DEPENDE DE MAIS DE UMA VARIÁVEL
G  f ( x1 , x2 ,...,xn )
Neste caso, para obter a incerteza G, usamos uma generalização de G 
Para esse fim temos que utilizar a derivada parcial
2

2
2
 G 
 G 
 G 
 xn 2
 x1 2  
 x2 2  .....
G  
 x1 
 x2 
 xn 

dG
x
dx
2
2
 sabendo que a mbm  (ab)m
 G

 G
  G

G   x1   
x2   .....
xn 
 x1
  x2

 xn

As derivadas parciais são calculadas em
2
x1  x1 , x2  x2 e xn  xn
28
Exemplo 3 : Cálculo da incerteza da velocidade.
v
x
t
ou
v  xt
1
A velocidade depende de duas variáveis : o espaço x que tem uma incerteza x e o
tempo t que tem uma incerteza t
 x  2.00 cm
x  2.0  0.5 cm 
x  0.05 cm
v
x 2.00

 0.6667 cm/s  0.7 cm/s
t
3.0
t  3.0 s
t  3.0  0.1 s 
t  0.1 s
nAS=2
 v   v 

v

 x    t 
Para calcular a incerteza da velocidade, v, utilizamos:
 x   t 
2
2
v
( xt 1 )
1
0.05
v ( xt 1 )
x
2
1
x 
x  t x  x 
 0.0167;

  xt 2   2   2  0.2222
x
x
t
3.0
t
t
t
3.0
 v 
0.0167 2   0.2222 2  0.2228
v  0.7  0.2 cm/s
nAS=2
29
Exemplo 4 : Cálculo do volume de um cilindro a partir do valor do diâmetro e da altura do
cilindro e da incerteza do volume.
D
D  3.015  0.025 mm
h  6.030  0.010 mm
 D  3.015 mm

D  0.025 mm
h
h  6.030 mm nAS=4

h  0.011 mm
2
π
 D
V  π  h  D 2 h
4
2
nAS=4
 V
  V

V  
D   
h 
 D
  h

2
e
2
D
Aπ
4
2
V
2πDh
πDh
πD h 3.015 6.030π




 28.55778408
D D D ,hh
4 D D ,h h
2 D D ,hh
2
2
V
h
D  D ,h h
πD2

4
D  D ,h h
πD 2 3.0152 π


 7.13944602
4
4
30
 V
  V

V  
D   
h 
 D
  h

2
2
D
Substituindo os valores na expressão acima
V 
28.55778408  0.025 2  7.13944602  0.0112
h
V  0.509716894 0.0061675744
26
D
Aπ
4
obtemos
2
V  0.718250978 0.718 mm3
π 2
3.0152  6.030
V D h
 43.0508595 43.05 nAS=4
4
4
V  V  V mm3
V  43.05  0.72 mm3
nAS=4
31
3 Representação gráfica
3.1 Regras básicas para construir gráficos
32
Exemplo do que não se deve fazer num gráfico
33
3.2 Barras de erro
A barra de erro tem por amplitude o valor do desvio padrão amostral. Quando olhamos
para um gráfico com barras de erro conseguimos visualizar a dispersão dos valores.
Por exemplo, para a primeira altura, h = 0.5m, os valores cronometrados
variaram aproximadamente entre 0.28 e 0.36 s, com um valor medio a 0.32 s.
34
3.3 Linearização de gráficos
35
Download

1ª Aula - Tratamento de dados