Estatística
Erros e var. aleatórias
Erros e variáveis aleatórias
Pontos mais importantes:
-tipos dos erros, exactidão e precisão
-variáveis aleatórias e seus tipos
-função de distribuição cumulativa
-função de distribuição de probabilidade, e função densidade
de probabilidade
-distribuições conjuntas de duas variáveis aleatórias
-valor de esperança matemática e suas propriedades
-variância e suas propriedades, covariância
-desigualdades de Markov e Chebyshev
1
Erros e var. aleatórias
Estatística
Revisão sugerida:
- Integração de funções simples (linear, exponencial)
- Integração de funções simples com duas variáveis
- Definição de funções matemáticos
- Definição de valor médio de uma função contínua
2
Erros e var. aleatórias
Estatística
Em qualquer área de estudos de que resultem valores numéricos,
é essencial uma estimativa dos erros associados à medição,
sem isso temos pouca informação.
-a concentração de ácido láctico em duas mostras de iogurte
produzido pela lactobacilos “A” e “B” são 100mg/l e 107 mg/l
respectivamente. Se o erro de determinação for 1 mg/l as
amostras são diferentes? E se o erro de determinação for 10
mg/l?
- Em quatro réplicas da mesma titulação resultam consumos de
24.69, 24.73, 24.77 e 25.39 ml. Podemos desprezar o último
valor?
3
Estatística
Erros e var. aleatórias
Tipos dos erros:
-erro grosso: um erro muito sério, a experiência tem que ser
repetida
-erro aleatório: resultados individuais andam à volta do valor
verdadeiro sem uma sequência previsível. A grandeza deste
tipo do erro determina a precisão da experiência. É
impossível eliminar, mas pode ser facilmente quantificado.
-erro sistemático: desvio de medição do valor verdadeiro no
mesmo sentido. O termo correspondente a este erro
chama-se exactidão. Geralmente é difícil identificar.
erro aleatório
erro sistemático
incerteza
4
Estatística
Erros e var. aleatórias
Exemplo: 4 alunos (A-D) titularam exactamente 10ml de 0.1M NaOH com
exactamente 0.1 HCl. A experiência foi repetida 5 vezes.
Resultado correcto
Preciso, não
exacto
A
B
Não preciso,
exacto
C
Não preciso,
não exacto
D
Preciso,
exacto
9.70
10.00
ml
10.30
5
Erros e var. aleatórias
Estatística
Objectivos da análise estatística:
-cuidadoso planeamento das experiências
-análise dos resultados e quantificação dos erros
6
Erros e var. aleatórias
Estatística
Variáveis aleatórias (v.a.):
o resultado (quantidade) de uma experiência (estatística) não se
conhece antecipadamente, pois pode ter vários valores, mas se
conhece as probabilidades de ocorrência, chama-se a isto uma
variável aleatória.
Seja X o total do lançamento de dois dados honestos:
P { X = 2} = P{( 1, 1)} = 1/ 36
P { X = 3} = P{( 1, 2),( 2, 1)} = 2/ 36
P { X = 4} = P{( 1, 3),( 2, 2),( 3, 1)} = 3/ 36
P { X = 5} = P{( 1, 4),( 2, 3),( 3, 2),( 4, 1)} = 4/ 36
P { X = 6} = P{( 1, 5),( 2, 4),( 3, 3),( 4, 2),( 5, 1)} = 5/ 36
P { X = 7} = P{( 1, 6),( 2, 5),( 3, 4),( 4, 3),( 5, 2),( 6, 1)} = 6/ 36
P { X = 8} = P{( 2, 6),( 3, 5),( 4, 4),( 5, 3),( 6, 2)} = 5/ 36
P { X = 9} = P{( 3, 6),( 4, 5),( 5, 4),( 6, 3)} = 4/ 36
P { X = 10} = P{( 4, 6),( 5, 5),( 6, 4)} = 3/ 36
P { X = 11} = P{( 5, 6),( 6, 5)} = 2/ 36
P { X = 12} = P{( 6, 6)} = 1/ 36
7
Erros e var. aleatórias
Estatística
Tipos de variáveis aleatórias:
-discreta: variável aleatória que só pode ter um número de
valores numeráveis
e.g. seja Y o número de vezes que se lança uma moeda
honesta até sair coroa.
P{ Y = 1} = 1/ 2
P{ Y = 2} = 1/ 4
...
P{ Y = n } = ½ (½) n -1
Y só pode assumir valores inteiros positivos; Os p Y n formam uma sequência
infinita numerável. X e Y são variáveis aleatórias discretas.
-contínua: pode assumir qualquer valor real positivo, o seu
domínio tem a potência do contínuo
e.g. duração da vida de uma automóvel
8
Estatística
Erros e var. aleatórias
Função de distribuição cumulativa:
Para descrever variáveis aleatórias e as suas probabilidades é
muito útil definir a função F de uma variável aleatória X,
F=P(Xx)
x
F é a probabilidade de X ter um valor menor ou igual a x.
Usando a Função de distribuição cumulativa podemos determinar todas
as probabilidades. Suponha que queremos calcular a probabilidade de
P(a<X b). Aplicando Axioma III temos,
P (Xb)= P (X  a)+P(a<X b)
F(b)
P(a<X b)= F(b)-F(a)
F(a)
9
Estatística
Erros e var. aleatórias
Características:
-crescente monótona
-F(-)=0
- F()=1
-todas as funções reais com estas características
definem funções de distribuição
Exemplo: qual é a probabilidade de X>1 se,
0

F(x)  
2
1  exp(x )
x0
x0
P(X>1)= 1-P(X1)= 1-F(1)= exp(-1)=0.386
10
Estatística
Erros e var. aleatórias
Função de distribuição de probabilidade:
Seja X uma variável aleatória discreta. A função de distribuição de
probabilidades p(a) de X é definida pela,
p(a)=P(X=a)
Características:
-X só pode ter valores x1,x2,...,xn, onde n é finito,
p(xi)>0,
i=1,2,...,n
p(x)=0,
todos outros

-
 p( x )  1
i 1
i
-a relação entre F(x) e p(x):
F(a )   p(x)
x a
-F(x) é uma função de degrau
11
Estatística
Erros e var. aleatórias
Exemplo: Seja X uma variável aleatória que pode assumir valores de 1,2,3 com as
respectivas probabilidades, 1/2, 1/3, 1/6
p(x)
p(1)=1/2
p(2)=1/3
p(3)=1/6
1/2
1/3
1/6
x
1
2
3
F(x)
 0
1 / 2

F(a )  
5 / 6
 1
a 1
1 a  2
2a 3
3a
1
5/6
1/2
x
1
2
3
12
Estatística
Erros e var. aleatórias
Função densidade de probabilidade:
No caso de uma variável contínua a probabilidade P(X=a)=0. Seja X
uma v.a. contínua, existe uma função não negativa f(x) definida
para xR, que tem a propriedade,
b
P(a  X  b)   f ( x )dx
a
onde f(x) chama-se Função densidade de probabilidade de X. A
probabilidade de X estar em (b-a) é igual o integral de f(x) sob b-a.
Também pode se dizer que a probabilidade de X estar na vizinhança
de “a” no intervalo e é igual a ef(a),
P(a 
e
e
Xa )
2
2
a
e
2
 f (x)dx  ef (a)
a
e
2
13
Estatística
Erros e var. aleatórias

Características:
-
1  P(  X  )   f (x)dx

a
-
P(X  a )   f ( x )dx  0
a
a
-
F(a )  P(X  a )   f (x)dx
f (a ) 

3
 (4x  2x 2 )
f (x)  8

0
Exemplo: Seja X uma v.a. tal que:
dF(a )
da
0x2
para outros
Calcule a probabilidade x>1!

2
2
3
p(x  1)   f (x)dx  f (x)dx   (4x  2x 2 )dx 0.5
8
1
1
1
14
Estatística
Erros e var. aleatórias
Distribuições conjuntas de duas v.a.:
Muitas vezes o que tem interesse é saber as probabilidades de duas
variáveis aleatórias. A definição de função de distribuição conjunta
de X e Y,
F(x,y)=P(Xx, Y y)
x,y
Teoricamente, qualquer questão de probabilidade sobre X e Y pode
ser calculada sabendo F(X,Y).
A função de distribuição de individuais,
F(x)= P(Xx)= P(Xx, Y )=F(x, );
F(y)= P(Yy)= P(X, Y y)=F(,y);
As características das funções de distribuição são também verdadeiras
para v.a. conjuntas
15
Estatística
Erros e var. aleatórias
No caso de variáveis discretas, a função de distribuição de probabilidade
de X (x1,x2,...) e Y (y1,y2,...) é definida pela:
p(xi,yj)=P(X=xi,Y=yj)
A função de distribuição de probabilidade individual (marginal) pode
obter-se:
pX (x i )  P(X  x i )   p(x i ,y j )
pY ( y j )  P(Y  y j )   p( xi ,y j )
i
j
Exemplo: Sequência das probabilidades de ter X filhos e Y filhas numa família
portuguesa se: 15% tem 0, 20% tem 1, 35% tem 2 e 30% tem 3 crianças.
i\j
0
1
2
3
p (Y j)
0
0. 15
0. 1000
0. 0875
0. 0375
0. 3750
1
0. 1000
0. 1750
0. 1125
0
0. 3875
2
0. 0875
0. 1125
0
0
0. 2000
3
0. 0375
0 0. 3875
0
0
0. 0375
p (X i)
0. 3750
0. 2000
0. 0375
1
16
Estatística
Erros e var. aleatórias
Se X e Y foram duas v.a.-s contínuas, existe uma função f(x,y) para
a qual se verifica:
d b
P(a  X  b, c  Y  d)    f ( x, y)dxdy
X,YR
c a
Onde f(x,y) se chama função densidade de probabilidade conjunta de
X e Y. As funções densidade de probabilidade marginais são dadas
por:
b 
b
a 
a
d 
d
c 
c
P(a  X  b)    f ( x, y)dydx   f X ( x )dx
P(c  Y  d)    f ( x, y)dxdy   f Y ( y)dy
A relação entre F(x,y) e f(x,y):
 2 F(b, d)
F(b, d)  P(X  b, Y  d)    f (x, y)dxdy 
 f (b, d) 
bd

d b
17
Estatística
Erros e var. aleatórias
Exemplo: Seja f(x,y) a função densidade de probabilidade conjunta das variáveis
aleatórias continuas X e Y:
0  x, y  
2e  x e 2 y
f ( x , y)  
 0
para outros
Calcule a) P(X>1,Y<1) e b) P(X<a).
1 
a)
P(X  1, Y  1)  

0 1
 x 2 y
2e e
1
dxdy   2e
0
2 y
( e
x 
1
)dy  e
1
1
 2e
2 y
dy 
0
 


1
 1
 2e 1    e  2 y 0  e 1 e  2  1  e 1 (1  e  2 )  31.8%
 2
b)
P( X  a )  
a
0


0
 
a
a

 1
2e  x e 2 y dydx   2e  x   e 2 y 0 dx   e  x  0  1dx 
0
0
 2

  e  x dx  e a  1  1  e a
a
0
Nota: Os conceitos de distribuição conjuntas podem ser facilmente
generalizados para “n” v.a.-s.
18
Estatística
Erros e var. aleatórias
Distribuições condicionais de duas v.a.:
P(EF)
P(E | F) 
P(F)
-Discretas:
Assim, é relativamente fácil definir a função de distr. de prob. condicional:
p( x | y) 
P ( X  x , Y  y) p( x , y)

P ( Y  y)
p Y ( y)
-Contínuas:
b
f ( x, y)
f ( x | y) 

 P(a  x  b | Y  y)   f ( x | y)dx
fY ( y )
a
-Independência:
p(x,y)=pX(x)pY(y)
f(x,y)=fX(x)fY(y)
19
Estatística
Erros e var. aleatórias
Valor de esperança matemática:
O valor esperança de uma variável aleatória discreta X é a média
pesada dos valores possíveis:
EX   x i P(X  x i )   x i p(x i )  
i
i
O factor de peso é a probabilidade do correspondente valor da v.a. Por
outras palavras, o valor de esperança é o valor médio que se obtém
após um grande número de repetições.
Exemplo: Seja X uma v.a. que representa o dinheiro que uma pessoa ganha num
jogo de azar (x1, x2, ... xn) com as probabilidades respectivas (p(x1), p(x2), ... P(xn)).
Calcule quanto é que pode esperar ganhar por jogo numa noite.
Aproximadamente toda noite Np(xi) vezes vamos ganhar xi (nota que ni= Np(xi)),
por isso o dinheiro total que vamos ganhar:
n
n
 x Np(x ) 
por jogo
i 1
i
i
 x Np(x )
i 1
i
i
N
n
  x i p( x i )  EX
i 1
20
Estatística
Erros e var. aleatórias
Um caso especial é quando todos os valores de v.a. tem a mesma
probabilidade:
x
1
EX   x i P(X  x i )   x i  i
N
N
i
i
i
Exemplo: Calcule o valor de esperança dos lançamentos do um dado
6
6
i 1
i 1
EX   x i p(x i )   ip(i) 
1 2  3  4  5  6
 3.5
6
21
Estatística
Erros e var. aleatórias
Agora, suponha que X é uma v.a. continua. A probabilidade de X
estar na vizinhança (para dx pequeno) de x é:
P(x<X<x+dx)f(x)dx
Com analogia ao caso de v.a. discreta o valor de esperança pode ser
facilmente obtida:
EX   xf (x)dx  


Exemplo: Suponha que uma aula teórica deve acabar alguns minutos depois hh:50
min. As que horas vai acabar a aula em média se a função densidade de
probabilidade do atraso é dada pela:
1

f ( x )  15
 0
0  x  15
para out ros
EX   xf ( x )dx  
15
15
0
0
x
152
dx 
 7.5
15
30
Em média a aula
acaba hh:58 min.
22
Estatística
Erros e var. aleatórias
Propriedades de valor de esperança matemática:
Dada uma v.a. X e a correspondente distribuição de probabilidade.
Suponha que estamos interessados no valor de esperança de uma
função de g(X) (E[g(X)]). Como se calcule?
Eg(X)   g(x i )P(X  x i )   g(x i )p(x i )
Discreta:
i
i
Exemplo: Seja X uma v.a. com a função de distr. de probabilidade:
p(0)=0.2
p(1)=0.5
p(2)=0.3
2
Calcule E[X ]


3
E g(X)  X   g( x i )p( x i )  0  0.2  1 0.5  4  .3  1.7
2
i 1
23
Estatística
Erros e var. aleatórias

Contínua:
Eg(X)   g(x)f (x)dx

Exemplo: O tempo que demora a localizar um problema no processamento de leite
(X) tem uma função densidade de probabilidade:
1
f (x)  
0
0  x 1
para outros
O custo relacionado a reparação é X3 mil contos. Qual é o custo esperado de
resolução dos problemas?
1
1
0
0
Eg(X)   g( x )f ( x )dx   x 3dx  0.25
24
Estatística
Erros e var. aleatórias
Caso especial: transformação linear de v.a., g(X)=aX+b, onde a e b
são constantes
Discreta:
EaX  b   (axi  b)p(x i )  a  x i p(x i )  b p(x i )  aEX  b
i
i
i
Contínua:






EaX  b   (ax  b)f (x)dx  a  xf (x)dx  b  f (x)dx  aEX  b
25
Estatística
Erros e var. aleatórias
As propriedades de valores de esperança pode ser aplicadas para
mais que uma v.a.
Eg(X, Y)   g(x, y)p(x, y)
Discreta:
y
Eg(X, Y) 
Contínua:
x
 
  g(x, y)f (x, y)dxdy

E.g.
EX  Y 
 
 
 
 


  (x  y)f (x, y)dxdy    xf (x, y)dxdy    yf(x, y)dxdy 







  x  f ( x, y)dy dx   y  f ( x, y)dx dy   xfX ( x )dx   yfY ( y)dy  EX  EY
  
  





E[X1+ X2+...+ Xn]= E[X1]+E[ X2]+...+E[ Xn]
26
Erros e var. aleatórias
Estatística
Variância:
As funções de distribuição de probabilidade podem-lhes tornar
complicadas, por isso seria muito útil somar as características mais
essenciais em umas medidas. O valor de esperança E[X] é um bom
candidato, mas insuficiente, porque não fornece informação sobre a
dispersão da v.a. em volta da média pesada.
E.g.: A altura dos adultos de Portugal em média é 1.70 m. Um extraterrestre de Marte
podia pensar que ninguém é mais alto que 1.71m, um outro de Vénus podia pensar que
há pessoas mais baixas que 0.1m.
O que longe os valores de X podem ser esperados da média )?:
-E[X-]=0
----> não funciona
-E[|X-|]
----> não é conveniente calcular o modulo
-E[(X-)2]
27
Estatística
Erros e var. aleatórias
Var(X)=E[(X-)2]=s2
Variância:
Cálculo alternativo:
s 2  Var(X)  E[(X- ) 2 ]  E[(X2 - 2X   2 )] 
 E[X2 ] - E[2X]  E[ 2 ]  E[X2 ] - 2E[X]  2 
 E[X2 ] -  2
Exemplo: Calcule a variância dos lançamentos do um dado
 
12  22  32  42  52  62 91
E X   i p(i) 

6
6
i 1
2
6
6
2
   ip(i) 
i 1
1 2  3  4  5  6 7

6
2
s2=91/6-(7/2)2=35/12
28
Estatística
Erros e var. aleatórias
Propriedades da variância:
Var(aX  b)  E[(aX b - E[aX  b])2 ] 
 E[(aX b - a  b) 2 ]  E[(aX- a) 2 ] 
 E[a2 (X - ) 2 ]  a 2 E[(X- ) 2 ]  a 2 Var (X)
Var(b)  0
Var(X  b)  Var (X)
Var(aX)  a 2Var (X)
Var(X  X)  Var (2X)  22 Var (X)
29
Estatística
Erros e var. aleatórias
Suponha que num supermercado o peso de embalagem de pimento
assado tem =0.5 kg com Var=0.05kg2. A dispersão é grande ou não?
É difícil avaliar, porque  e Var(X) não têm a mesma dimensão.
Desvio padrão (s):
s  Var (X)
No exemplo anterior, =0.5 kg e s=0.22kg, a dispersão dos peso
das embalagens é bastante grande.
30
Estatística
Erros e var. aleatórias
Covariância:
A covariância é medida de dependência linear entre variáveis
aleatórias. Definição de covariância de duas v.a.:
s x s y  Cov(X,Y)  E[(X-  x )(Y -  y )]  E[XY-  x Y -  y X   x  y ] 
 E[XY]-  x E[Y]   y E[X]   x  y 
 E[XY]-  x  y   y x   x  y  E[XY]- E[X]E[Y]
Propriedades:
a) Cov(X,Y)=Cov(Y,X)
b) Cov(X,X)=Var(X)
c) Cov(aX,Y)=aCov(X,Y)
d) Cov(X+Z,Y)=Cov(X,Y)+Cov(Z,Y)
e) v.a. independentes Cov(X,Y)=0
31
Estatística
Erros e var. aleatórias
Propriedade d) pode ser generalizada para a covariância de SX e SY:
m
 n
 n m
Cov  Xi , Yj    Cov(X i Yj )
j1
 i 1
 i 1 j1
Assim, a variância de soma de n v.a.-s pode ser determinada usando
a propriedade b:
n
n m
 n

 n
 n
Cov  Xi , X j   Var   Xi    Var (Xi )  Cov(Xi Yj )
j1
i 1 j1
 i 1  i 1
 i 1

ji
Independência(!):
 n
 n
Var   Xi    Var (Xi )
 i 1  i 1
32
Estatística
Erros e var. aleatórias
Exemplos para Cov(X,Y)0:
-altura e peso das pessoas: Pessoas mais altas tendem ser mais pesadas-----> cov>0
-velocidade de reacção dos condutores e a quantidade de álcool consumido: com
aumento de álcool bebido, a velocidade de reacção diminuí-----> cov<0
O valor de covariância depende das unidades usadas no cálculo
(kg/g; min/s; l/ml, etc.). A “covariância normalizada” chama-se
coeficiente de correlação:
1  x , y  Corr(X, Y) 
Cov(X, Y)
 1
Var (X)Var (Y)
Independência: x,y=0
33
Estatística
Erros e var. aleatórias
Por vezes dado um número de v.a. (e.g. parâmetros de um modelo
matemático) e queremos saber a dependência linear entre eles. O
resultado é a matriz de covariância (simétrica):
 s 2 x1

s x 2 s x1

sxi sx j 
 

s x n s x1
 s x1 s x n 


 

 

2
 s x n 
s x1 s x 2
s2 x 2


Ou em termos de coeficiente de correlação:
xix j
 1

x 2 x1


 

 x n x1
 x1x 2
1


  x1x n 

 

 


1 
34
Estatística
Erros e var. aleatórias
Desigualdades de Markov e Chebyshev:
-Desigualdade de Markov: se a v.a. X for não-negativa, então:
EX 
a
P( X  a ) 
a  0
v.a. contínua:
EX    xf ( x)dx   xf ( x)dx   xf ( x)dx   xf ( x)dx

a


0
0
a
a


a
a
  af ( x)dx  a  f ( x)dx  aP( X  a)
-Desigualdade de Chebyshev: seja a=k2 e a v.a. não-negativa igual a
(X-)2:


E ( X  ) 2 s 2
P( X    k )  P((X  )  k ) 
 2
2
k
k
2
2
35
Estatística
Erros e var. aleatórias
A importância destas desigualdades é que permitem estabelecer
limites de probabilidades quando só a média e/ou a variância estão
conhecidas (sem saber a função de distribuição de probabilidade)
Exemplo: O número de testes feitos num laboratório de controlo de qualidade em
média 50/dia.
-Calcule o limite da probabilidade do número de testes exceder 75 num dia!
P(X>75)E[X]/75=50/75=2/3
-se a variância for 25, qual é o limite de prob. de o número de testes serem cera de
40-60/dia?
P(|X-50|10) s2/102=1/4 ------> P(|X-50|<10) >1-1/4=3/4
36
Download

Document