Estatística Erros e var. aleatórias Erros e variáveis aleatórias Pontos mais importantes: -tipos dos erros, exactidão e precisão -variáveis aleatórias e seus tipos -função de distribuição cumulativa -função de distribuição de probabilidade, e função densidade de probabilidade -distribuições conjuntas de duas variáveis aleatórias -valor de esperança matemática e suas propriedades -variância e suas propriedades, covariância -desigualdades de Markov e Chebyshev 1 Erros e var. aleatórias Estatística Revisão sugerida: - Integração de funções simples (linear, exponencial) - Integração de funções simples com duas variáveis - Definição de funções matemáticos - Definição de valor médio de uma função contínua 2 Erros e var. aleatórias Estatística Em qualquer área de estudos de que resultem valores numéricos, é essencial uma estimativa dos erros associados à medição, sem isso temos pouca informação. -a concentração de ácido láctico em duas mostras de iogurte produzido pela lactobacilos “A” e “B” são 100mg/l e 107 mg/l respectivamente. Se o erro de determinação for 1 mg/l as amostras são diferentes? E se o erro de determinação for 10 mg/l? - Em quatro réplicas da mesma titulação resultam consumos de 24.69, 24.73, 24.77 e 25.39 ml. Podemos desprezar o último valor? 3 Estatística Erros e var. aleatórias Tipos dos erros: -erro grosso: um erro muito sério, a experiência tem que ser repetida -erro aleatório: resultados individuais andam à volta do valor verdadeiro sem uma sequência previsível. A grandeza deste tipo do erro determina a precisão da experiência. É impossível eliminar, mas pode ser facilmente quantificado. -erro sistemático: desvio de medição do valor verdadeiro no mesmo sentido. O termo correspondente a este erro chama-se exactidão. Geralmente é difícil identificar. erro aleatório erro sistemático incerteza 4 Estatística Erros e var. aleatórias Exemplo: 4 alunos (A-D) titularam exactamente 10ml de 0.1M NaOH com exactamente 0.1 HCl. A experiência foi repetida 5 vezes. Resultado correcto Preciso, não exacto A B Não preciso, exacto C Não preciso, não exacto D Preciso, exacto 9.70 10.00 ml 10.30 5 Erros e var. aleatórias Estatística Objectivos da análise estatística: -cuidadoso planeamento das experiências -análise dos resultados e quantificação dos erros 6 Erros e var. aleatórias Estatística Variáveis aleatórias (v.a.): o resultado (quantidade) de uma experiência (estatística) não se conhece antecipadamente, pois pode ter vários valores, mas se conhece as probabilidades de ocorrência, chama-se a isto uma variável aleatória. Seja X o total do lançamento de dois dados honestos: P { X = 2} = P{( 1, 1)} = 1/ 36 P { X = 3} = P{( 1, 2),( 2, 1)} = 2/ 36 P { X = 4} = P{( 1, 3),( 2, 2),( 3, 1)} = 3/ 36 P { X = 5} = P{( 1, 4),( 2, 3),( 3, 2),( 4, 1)} = 4/ 36 P { X = 6} = P{( 1, 5),( 2, 4),( 3, 3),( 4, 2),( 5, 1)} = 5/ 36 P { X = 7} = P{( 1, 6),( 2, 5),( 3, 4),( 4, 3),( 5, 2),( 6, 1)} = 6/ 36 P { X = 8} = P{( 2, 6),( 3, 5),( 4, 4),( 5, 3),( 6, 2)} = 5/ 36 P { X = 9} = P{( 3, 6),( 4, 5),( 5, 4),( 6, 3)} = 4/ 36 P { X = 10} = P{( 4, 6),( 5, 5),( 6, 4)} = 3/ 36 P { X = 11} = P{( 5, 6),( 6, 5)} = 2/ 36 P { X = 12} = P{( 6, 6)} = 1/ 36 7 Erros e var. aleatórias Estatística Tipos de variáveis aleatórias: -discreta: variável aleatória que só pode ter um número de valores numeráveis e.g. seja Y o número de vezes que se lança uma moeda honesta até sair coroa. P{ Y = 1} = 1/ 2 P{ Y = 2} = 1/ 4 ... P{ Y = n } = ½ (½) n -1 Y só pode assumir valores inteiros positivos; Os p Y n formam uma sequência infinita numerável. X e Y são variáveis aleatórias discretas. -contínua: pode assumir qualquer valor real positivo, o seu domínio tem a potência do contínuo e.g. duração da vida de uma automóvel 8 Estatística Erros e var. aleatórias Função de distribuição cumulativa: Para descrever variáveis aleatórias e as suas probabilidades é muito útil definir a função F de uma variável aleatória X, F=P(Xx) x F é a probabilidade de X ter um valor menor ou igual a x. Usando a Função de distribuição cumulativa podemos determinar todas as probabilidades. Suponha que queremos calcular a probabilidade de P(a<X b). Aplicando Axioma III temos, P (Xb)= P (X a)+P(a<X b) F(b) P(a<X b)= F(b)-F(a) F(a) 9 Estatística Erros e var. aleatórias Características: -crescente monótona -F(-)=0 - F()=1 -todas as funções reais com estas características definem funções de distribuição Exemplo: qual é a probabilidade de X>1 se, 0 F(x) 2 1 exp(x ) x0 x0 P(X>1)= 1-P(X1)= 1-F(1)= exp(-1)=0.386 10 Estatística Erros e var. aleatórias Função de distribuição de probabilidade: Seja X uma variável aleatória discreta. A função de distribuição de probabilidades p(a) de X é definida pela, p(a)=P(X=a) Características: -X só pode ter valores x1,x2,...,xn, onde n é finito, p(xi)>0, i=1,2,...,n p(x)=0, todos outros - p( x ) 1 i 1 i -a relação entre F(x) e p(x): F(a ) p(x) x a -F(x) é uma função de degrau 11 Estatística Erros e var. aleatórias Exemplo: Seja X uma variável aleatória que pode assumir valores de 1,2,3 com as respectivas probabilidades, 1/2, 1/3, 1/6 p(x) p(1)=1/2 p(2)=1/3 p(3)=1/6 1/2 1/3 1/6 x 1 2 3 F(x) 0 1 / 2 F(a ) 5 / 6 1 a 1 1 a 2 2a 3 3a 1 5/6 1/2 x 1 2 3 12 Estatística Erros e var. aleatórias Função densidade de probabilidade: No caso de uma variável contínua a probabilidade P(X=a)=0. Seja X uma v.a. contínua, existe uma função não negativa f(x) definida para xR, que tem a propriedade, b P(a X b) f ( x )dx a onde f(x) chama-se Função densidade de probabilidade de X. A probabilidade de X estar em (b-a) é igual o integral de f(x) sob b-a. Também pode se dizer que a probabilidade de X estar na vizinhança de “a” no intervalo e é igual a ef(a), P(a e e Xa ) 2 2 a e 2 f (x)dx ef (a) a e 2 13 Estatística Erros e var. aleatórias Características: - 1 P( X ) f (x)dx a - P(X a ) f ( x )dx 0 a a - F(a ) P(X a ) f (x)dx f (a ) 3 (4x 2x 2 ) f (x) 8 0 Exemplo: Seja X uma v.a. tal que: dF(a ) da 0x2 para outros Calcule a probabilidade x>1! 2 2 3 p(x 1) f (x)dx f (x)dx (4x 2x 2 )dx 0.5 8 1 1 1 14 Estatística Erros e var. aleatórias Distribuições conjuntas de duas v.a.: Muitas vezes o que tem interesse é saber as probabilidades de duas variáveis aleatórias. A definição de função de distribuição conjunta de X e Y, F(x,y)=P(Xx, Y y) x,y Teoricamente, qualquer questão de probabilidade sobre X e Y pode ser calculada sabendo F(X,Y). A função de distribuição de individuais, F(x)= P(Xx)= P(Xx, Y )=F(x, ); F(y)= P(Yy)= P(X, Y y)=F(,y); As características das funções de distribuição são também verdadeiras para v.a. conjuntas 15 Estatística Erros e var. aleatórias No caso de variáveis discretas, a função de distribuição de probabilidade de X (x1,x2,...) e Y (y1,y2,...) é definida pela: p(xi,yj)=P(X=xi,Y=yj) A função de distribuição de probabilidade individual (marginal) pode obter-se: pX (x i ) P(X x i ) p(x i ,y j ) pY ( y j ) P(Y y j ) p( xi ,y j ) i j Exemplo: Sequência das probabilidades de ter X filhos e Y filhas numa família portuguesa se: 15% tem 0, 20% tem 1, 35% tem 2 e 30% tem 3 crianças. i\j 0 1 2 3 p (Y j) 0 0. 15 0. 1000 0. 0875 0. 0375 0. 3750 1 0. 1000 0. 1750 0. 1125 0 0. 3875 2 0. 0875 0. 1125 0 0 0. 2000 3 0. 0375 0 0. 3875 0 0 0. 0375 p (X i) 0. 3750 0. 2000 0. 0375 1 16 Estatística Erros e var. aleatórias Se X e Y foram duas v.a.-s contínuas, existe uma função f(x,y) para a qual se verifica: d b P(a X b, c Y d) f ( x, y)dxdy X,YR c a Onde f(x,y) se chama função densidade de probabilidade conjunta de X e Y. As funções densidade de probabilidade marginais são dadas por: b b a a d d c c P(a X b) f ( x, y)dydx f X ( x )dx P(c Y d) f ( x, y)dxdy f Y ( y)dy A relação entre F(x,y) e f(x,y): 2 F(b, d) F(b, d) P(X b, Y d) f (x, y)dxdy f (b, d) bd d b 17 Estatística Erros e var. aleatórias Exemplo: Seja f(x,y) a função densidade de probabilidade conjunta das variáveis aleatórias continuas X e Y: 0 x, y 2e x e 2 y f ( x , y) 0 para outros Calcule a) P(X>1,Y<1) e b) P(X<a). 1 a) P(X 1, Y 1) 0 1 x 2 y 2e e 1 dxdy 2e 0 2 y ( e x 1 )dy e 1 1 2e 2 y dy 0 1 1 2e 1 e 2 y 0 e 1 e 2 1 e 1 (1 e 2 ) 31.8% 2 b) P( X a ) a 0 0 a a 1 2e x e 2 y dydx 2e x e 2 y 0 dx e x 0 1dx 0 0 2 e x dx e a 1 1 e a a 0 Nota: Os conceitos de distribuição conjuntas podem ser facilmente generalizados para “n” v.a.-s. 18 Estatística Erros e var. aleatórias Distribuições condicionais de duas v.a.: P(EF) P(E | F) P(F) -Discretas: Assim, é relativamente fácil definir a função de distr. de prob. condicional: p( x | y) P ( X x , Y y) p( x , y) P ( Y y) p Y ( y) -Contínuas: b f ( x, y) f ( x | y) P(a x b | Y y) f ( x | y)dx fY ( y ) a -Independência: p(x,y)=pX(x)pY(y) f(x,y)=fX(x)fY(y) 19 Estatística Erros e var. aleatórias Valor de esperança matemática: O valor esperança de uma variável aleatória discreta X é a média pesada dos valores possíveis: EX x i P(X x i ) x i p(x i ) i i O factor de peso é a probabilidade do correspondente valor da v.a. Por outras palavras, o valor de esperança é o valor médio que se obtém após um grande número de repetições. Exemplo: Seja X uma v.a. que representa o dinheiro que uma pessoa ganha num jogo de azar (x1, x2, ... xn) com as probabilidades respectivas (p(x1), p(x2), ... P(xn)). Calcule quanto é que pode esperar ganhar por jogo numa noite. Aproximadamente toda noite Np(xi) vezes vamos ganhar xi (nota que ni= Np(xi)), por isso o dinheiro total que vamos ganhar: n n x Np(x ) por jogo i 1 i i x Np(x ) i 1 i i N n x i p( x i ) EX i 1 20 Estatística Erros e var. aleatórias Um caso especial é quando todos os valores de v.a. tem a mesma probabilidade: x 1 EX x i P(X x i ) x i i N N i i i Exemplo: Calcule o valor de esperança dos lançamentos do um dado 6 6 i 1 i 1 EX x i p(x i ) ip(i) 1 2 3 4 5 6 3.5 6 21 Estatística Erros e var. aleatórias Agora, suponha que X é uma v.a. continua. A probabilidade de X estar na vizinhança (para dx pequeno) de x é: P(x<X<x+dx)f(x)dx Com analogia ao caso de v.a. discreta o valor de esperança pode ser facilmente obtida: EX xf (x)dx Exemplo: Suponha que uma aula teórica deve acabar alguns minutos depois hh:50 min. As que horas vai acabar a aula em média se a função densidade de probabilidade do atraso é dada pela: 1 f ( x ) 15 0 0 x 15 para out ros EX xf ( x )dx 15 15 0 0 x 152 dx 7.5 15 30 Em média a aula acaba hh:58 min. 22 Estatística Erros e var. aleatórias Propriedades de valor de esperança matemática: Dada uma v.a. X e a correspondente distribuição de probabilidade. Suponha que estamos interessados no valor de esperança de uma função de g(X) (E[g(X)]). Como se calcule? Eg(X) g(x i )P(X x i ) g(x i )p(x i ) Discreta: i i Exemplo: Seja X uma v.a. com a função de distr. de probabilidade: p(0)=0.2 p(1)=0.5 p(2)=0.3 2 Calcule E[X ] 3 E g(X) X g( x i )p( x i ) 0 0.2 1 0.5 4 .3 1.7 2 i 1 23 Estatística Erros e var. aleatórias Contínua: Eg(X) g(x)f (x)dx Exemplo: O tempo que demora a localizar um problema no processamento de leite (X) tem uma função densidade de probabilidade: 1 f (x) 0 0 x 1 para outros O custo relacionado a reparação é X3 mil contos. Qual é o custo esperado de resolução dos problemas? 1 1 0 0 Eg(X) g( x )f ( x )dx x 3dx 0.25 24 Estatística Erros e var. aleatórias Caso especial: transformação linear de v.a., g(X)=aX+b, onde a e b são constantes Discreta: EaX b (axi b)p(x i ) a x i p(x i ) b p(x i ) aEX b i i i Contínua: EaX b (ax b)f (x)dx a xf (x)dx b f (x)dx aEX b 25 Estatística Erros e var. aleatórias As propriedades de valores de esperança pode ser aplicadas para mais que uma v.a. Eg(X, Y) g(x, y)p(x, y) Discreta: y Eg(X, Y) Contínua: x g(x, y)f (x, y)dxdy E.g. EX Y (x y)f (x, y)dxdy xf (x, y)dxdy yf(x, y)dxdy x f ( x, y)dy dx y f ( x, y)dx dy xfX ( x )dx yfY ( y)dy EX EY E[X1+ X2+...+ Xn]= E[X1]+E[ X2]+...+E[ Xn] 26 Erros e var. aleatórias Estatística Variância: As funções de distribuição de probabilidade podem-lhes tornar complicadas, por isso seria muito útil somar as características mais essenciais em umas medidas. O valor de esperança E[X] é um bom candidato, mas insuficiente, porque não fornece informação sobre a dispersão da v.a. em volta da média pesada. E.g.: A altura dos adultos de Portugal em média é 1.70 m. Um extraterrestre de Marte podia pensar que ninguém é mais alto que 1.71m, um outro de Vénus podia pensar que há pessoas mais baixas que 0.1m. O que longe os valores de X podem ser esperados da média )?: -E[X-]=0 ----> não funciona -E[|X-|] ----> não é conveniente calcular o modulo -E[(X-)2] 27 Estatística Erros e var. aleatórias Var(X)=E[(X-)2]=s2 Variância: Cálculo alternativo: s 2 Var(X) E[(X- ) 2 ] E[(X2 - 2X 2 )] E[X2 ] - E[2X] E[ 2 ] E[X2 ] - 2E[X] 2 E[X2 ] - 2 Exemplo: Calcule a variância dos lançamentos do um dado 12 22 32 42 52 62 91 E X i p(i) 6 6 i 1 2 6 6 2 ip(i) i 1 1 2 3 4 5 6 7 6 2 s2=91/6-(7/2)2=35/12 28 Estatística Erros e var. aleatórias Propriedades da variância: Var(aX b) E[(aX b - E[aX b])2 ] E[(aX b - a b) 2 ] E[(aX- a) 2 ] E[a2 (X - ) 2 ] a 2 E[(X- ) 2 ] a 2 Var (X) Var(b) 0 Var(X b) Var (X) Var(aX) a 2Var (X) Var(X X) Var (2X) 22 Var (X) 29 Estatística Erros e var. aleatórias Suponha que num supermercado o peso de embalagem de pimento assado tem =0.5 kg com Var=0.05kg2. A dispersão é grande ou não? É difícil avaliar, porque e Var(X) não têm a mesma dimensão. Desvio padrão (s): s Var (X) No exemplo anterior, =0.5 kg e s=0.22kg, a dispersão dos peso das embalagens é bastante grande. 30 Estatística Erros e var. aleatórias Covariância: A covariância é medida de dependência linear entre variáveis aleatórias. Definição de covariância de duas v.a.: s x s y Cov(X,Y) E[(X- x )(Y - y )] E[XY- x Y - y X x y ] E[XY]- x E[Y] y E[X] x y E[XY]- x y y x x y E[XY]- E[X]E[Y] Propriedades: a) Cov(X,Y)=Cov(Y,X) b) Cov(X,X)=Var(X) c) Cov(aX,Y)=aCov(X,Y) d) Cov(X+Z,Y)=Cov(X,Y)+Cov(Z,Y) e) v.a. independentes Cov(X,Y)=0 31 Estatística Erros e var. aleatórias Propriedade d) pode ser generalizada para a covariância de SX e SY: m n n m Cov Xi , Yj Cov(X i Yj ) j1 i 1 i 1 j1 Assim, a variância de soma de n v.a.-s pode ser determinada usando a propriedade b: n n m n n n Cov Xi , X j Var Xi Var (Xi ) Cov(Xi Yj ) j1 i 1 j1 i 1 i 1 i 1 ji Independência(!): n n Var Xi Var (Xi ) i 1 i 1 32 Estatística Erros e var. aleatórias Exemplos para Cov(X,Y)0: -altura e peso das pessoas: Pessoas mais altas tendem ser mais pesadas-----> cov>0 -velocidade de reacção dos condutores e a quantidade de álcool consumido: com aumento de álcool bebido, a velocidade de reacção diminuí-----> cov<0 O valor de covariância depende das unidades usadas no cálculo (kg/g; min/s; l/ml, etc.). A “covariância normalizada” chama-se coeficiente de correlação: 1 x , y Corr(X, Y) Cov(X, Y) 1 Var (X)Var (Y) Independência: x,y=0 33 Estatística Erros e var. aleatórias Por vezes dado um número de v.a. (e.g. parâmetros de um modelo matemático) e queremos saber a dependência linear entre eles. O resultado é a matriz de covariância (simétrica): s 2 x1 s x 2 s x1 sxi sx j s x n s x1 s x1 s x n 2 s x n s x1 s x 2 s2 x 2 Ou em termos de coeficiente de correlação: xix j 1 x 2 x1 x n x1 x1x 2 1 x1x n 1 34 Estatística Erros e var. aleatórias Desigualdades de Markov e Chebyshev: -Desigualdade de Markov: se a v.a. X for não-negativa, então: EX a P( X a ) a 0 v.a. contínua: EX xf ( x)dx xf ( x)dx xf ( x)dx xf ( x)dx a 0 0 a a a a af ( x)dx a f ( x)dx aP( X a) -Desigualdade de Chebyshev: seja a=k2 e a v.a. não-negativa igual a (X-)2: E ( X ) 2 s 2 P( X k ) P((X ) k ) 2 2 k k 2 2 35 Estatística Erros e var. aleatórias A importância destas desigualdades é que permitem estabelecer limites de probabilidades quando só a média e/ou a variância estão conhecidas (sem saber a função de distribuição de probabilidade) Exemplo: O número de testes feitos num laboratório de controlo de qualidade em média 50/dia. -Calcule o limite da probabilidade do número de testes exceder 75 num dia! P(X>75)E[X]/75=50/75=2/3 -se a variância for 25, qual é o limite de prob. de o número de testes serem cera de 40-60/dia? P(|X-50|10) s2/102=1/4 ------> P(|X-50|<10) >1-1/4=3/4 36