Universidade Federal do Pará Instituto de Tecnologia Estatística Aplicada I Prof. Dr. Jorge Teófilo de Barros Lopes Campus Universitário de Tucuruí – CTUC Curso de Engenharia Mecânica 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Teoria das Probabilidades Universidade Federal do Pará Instituto de Tecnologia Capítulo III Variáveis Aleatórias Campus Universitário de Tucuruí – CTUC Curso de Engenharia Mecânica 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias III – Variáveis Aleatórias Introdução Varíáveis aleatórias discretas Variáveis aleatórias contínuas Parâmetros das variáveis aleatórias Variáveis aleatórias bidimensionais 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias III – Variáveis Aleatórias Introdução Varíáveis aleatórias discretas Variáveis aleatórias contínuas Parâmetros das variáveis aleatórias Variáveis aleatórias bidimensionais 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.1 Introdução Em um experimento aleatório, uma variável cujo valor medido pode variar de uma réplica do experimento para outra é referida como variável aleatória. Exemplos: X pode denotar a medida da resistência mecânica no ensaio de tração de um material; Y representar o diâmetro de uma peça usinada; Z expressar a resistividade do solo em um processo corrosivo em torres de linha de transmissão. As variáveis aleatórias (V.A) surgem em função da necessidade de se representar os resultados de uma experiência aleatória por meio de números reais. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.1 Introdução Definição • Uma variável aleatória pode ser expressa como uma função definida num espaço de resultados S e que tem como contradomínio os números reais. • Seja E um experimento e S o espaço associado a ele. Uma função X, que associe a cada elemento s ∈ S um número real X(s) é denominada variável aleatória. S s 04/11/2015 22:38 X R Variável aleatória X(s) ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.1 Introdução Definição • Exemplo: E : Lançamento de duas moedas; X : Número de caras (a) obtidas nas duas moedas; S : {(c, c), (c, k), (k, c), (k, k)} X = 0 → correspondente ao evento (k, k) com probabilidade ¼; X = 1 → correspondente ao evento (k, c), (c, k) com probabilidade ½; X = 2 → correspondente ao evento (c, c) com probabilidade ¼. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.1 Introdução Classificação • As variáveis aleatórias classificam-se em discretas ou contínuas, dependendo do tipo de conjunto de valores que elas podem assumir. - Variável discreta: quando a variável assume valores num conjunto finito ou infinito numerável. - Variável contínua: quando a variável assume valores de um conjunto infinito não numerável. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.1 Introdução Classificação • Exemplos: - A V.A resultado do lançamento de um dado é discreta; - A V.A que representa o tempo que um atleta leva para completar a prova dos 100 metros é contínua se for admitido que é medida com precisão absoluta. - A V.A que representa as medidas de corrente elétrica a partir de um instrumento digital que mostre a corrente para o mais próximo centésimo de miliampére é discreta (as medidas possíveis são limitadas). 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.1 Introdução Representação • As variáveis aleatórias são representadas por letras maiúsculas (X, Y, Z, W, ...), e os valores que elas podem assumir são representados pelas correspondentes letras minúsculas (x, y, z, w, ...). Exemplo: • E: Medição do peso de uma pessoa escolhida ao acaso. S = {Conjunto de todos os pesos atribuíveis a uma pessoa}. X = O peso da pessoa (assume qualquer valor do espaço de resultados). x = 1,65 m (a altura de uma das pessoas). 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.1 Introdução Observação: • Existem situações em que os valores da variável aleatória não são os resultados do espaço associado ao experimento, mas sim uma transformação destes. - Exemplo: E: Lançamento de dois dados. S = Conjunto dos valores obtidos pelos dois dados, num total de trinta e seis resultados possíveis (tamanho de S = 36) S = {( x, y ) | x, y = 1,2,3,4,5,6}. X = V.A que representa a soma dos números dos pontos dos dois dados, a qual pode assumir qualquer valor inteiro de 2 a 12, ou X(s) = {2,3,4, 5, 6, 7, 8, 9, 10, 11,12}. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.1 Introdução Observação: • No mesmo espaço associado ao experimento anterior poder-se-ia definir outra variável aleatória. - Exemplo: Y = V.A que representa a diferença, em valor absoluto, dos números dos pontos dos dois dados, a qual pode assumir qualquer valor inteiro de 0 a 5, ou Y(s) = {0,1,2,3,4,5 } 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias III – Variáveis Aleatórias Introdução Varíáveis aleatórias discretas Variáveis aleatórias contínuas Parâmetros das variáveis aleatórias Variáveis aleatórias bidimensionais 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função de probabilidade • A distribuição de probabilidade de uma variável aleatória qualquer X é uma descrição das probabilidades associadas com os valores possíveis de X. • Para uma variável aleatória discreta, a distribuição é freqüentemente especificada por apenas uma lista de valores possíveis juntamente com a probabilidade de cada um. • Em alguns casos, é conveniente expressar a probabilidade em termos de uma fórmula. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função de probabilidade • Define-se como função de probabilidade, f, a função que associa a cada valor que a variável pode assumir, a probabilidade da variável assumir esse valor. • Para uma variável aleatória discreta X, com valores possíveis x1, x2, ..., xn, a função de probabilidade é f ( x i ) P( X x i ) • Já que f(xi) é definida como n uma probabilidade, então f ( x i ) 0 para todo xi e f ( x i ) 1 i 1 • P(X) pode ser expresa por uma tabela, gráfico ou fórmula. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função de probabilidade • Exemplo: E: Lançamento de duas moedas. X: nº de caras obtidas. P(X) pode ser expressa das seguintes formas: 0 1 2 P(x) 1/4 1/2 1/4 1 P( x ) C 2 ,x 4 04/11/2015 22:38 P(x) x 1 ½ ¼ 0 1 2 x ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função de probabilidade • Exemplo: Seja X a variável aleatória que representa o resultado do lançamento de um dado equilibrado. A função de probabilidade é definida por: f (1) 1 1 1 1 1 1 , f ( 2 ) , f ( 3 ) , f (4 ) , f (5 ) , f (6 ) 6 6 6 6 6 6 Em termos de notação e de modo a simplificar, a função de probabilidade pode ser representada por meio de uma tabela, assumindo que os valores que não aparecem na tabela têm probabilidade zero de ocorrer. Neste exemplo tem-se, então: 04/11/2015 22:38 x 1 2 3 4 5 6 f(x)=P(x) 1/6 1/6 1/6 1/6 1/6 1/6 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função de probabilidade • Observações: - Se uma variável aleatória X apresentar f(x) ≠ 0 e constante para todos os valores de x, diz-se que essa V.A tem uma distribuição uniforme (discreta). - Qualquer função de uma variável aleatória é também uma variável aleatória, isto é, se X é V.A, então Y = φ(x) também será. Exemplos: X → V.A pontos de um dados; Y = X + X → V.A; Z = Max {(x1, x2)} onde (x1, x2) são pontos de dois dados. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função distribuição cumulativa • Uma função distribuição cumulativa, também chamada função repartição ou função distribuição de probabilidades, pode também ser usada para fornecer a distribuição de probabilidades de uma variável discreta. • A função distribuição cumulativa em um valor de x é a soma das probabilidades em todos os pontos menores ou iguais a x. • Define-se, então, como função distribuição cumulativa de uma certa variável aleatória X, no ponto x, como sendo a probabilidade de que X assuma um valor menor ou igual a x, isto é: F ( x ) P( X x ) f(x xi x 04/11/2015 22:38 i ) ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função distribuição cumulativa • Exemplo (Montgomery et al., 2001): Há uma chance de que um bit transmitido através de um canal de transmissão digital seja recebido com erro. Considere X igual ao número de bits com erro nos quatro próximos bits transmitidos. Os valores possíveis para a variável aleatória X são {0, 1, 2, 3, 4}. Com base em um modelo de probabilidades, as probabilidades para esses valores foram determinados como sendo: P(X = 0) = 0,6561 P(X = 3) = 0,0036 04/11/2015 22:38 P(X = 1) = 0,2916 P(X = 4) = 0,0001 P(X = 2) = 0,0486 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função distribuição cumulativa • Exemplo (cont.): - A distribuição de probabilidades de X é especificada pelos valores possíveis, juntamente com a probabilidade de cada um. A figura mostra uma descrição gráfica dessa distribuição: f(x) 0,6561 0,2916 0,0036 0,0001 0,0486 0 04/11/2015 22:38 1 2 3 4 x ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função distribuição cumulativa • Exemplo (cont.): - Por conseguinte, a função distribuição cumulativa de X será: F(0) = 0,6561 F(3) = 0,9999 F(1) = 0,9477 F(4) = 1 F(2) = 0,9963 - Mesmo se a variável aleatória puder assumir somente valores inteiros, a função distribuição cumulativa é definida em valores não inteiros. Por exemplo: F(1,5) = P(X ≤ 1,5) = P(X ≤ 1) = 0,9477 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função distribuição cumulativa • Exemplo (cont.): - O gráfico do exemplo é mostrado abaixo, onde se observa que o mesmo apresenta descontinuidades (saltos) nos valores discretos para X. O tamanho do salto em um ponto x é igual à probabilidade em x. F(x) 1 0,8 0,6 0,4 0,2 0 0 04/11/2015 22:38 1 2 3 4 5 x ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função distribuição cumulativa • Propriedades: 1. 2. 3. 4. 5. 6. 7. 04/11/2015 22:38 0 ≤ F(x) ≤ 1 , para todo x F(- ∞) = 0 F(+∞) = 1 P(a < X ≤ b) = F(b) – F(a) P(a ≤ X ≤ b) = F(b) – F(a) + P(X = a) P(a < X < b) = F(b) – F(a) – P(X = b) lim F(x) = 1 e lim F(x) = 0 x → +∞ x → -∞ ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.2 Variáveis Aleatórias Discretas Função distribuição cumulativa • Propriedades: - Exemplo: Do exemplo anterior, tem-se: 0 0 ,6561 0 ,9477 F( x ) 0 ,9963 0 ,9999 1 04/11/2015 22:38 se se se se se se x0 0 x1 1 x 2 2 x3 3 x4 x4 ESTATÍSTICA APLICADA I - Variáveis Aleatórias III – Variáveis Aleatórias Introdução Varíáveis aleatórias discretas Variáveis aleatórias contínuas Parâmetros das variáveis aleatórias Variáveis aleatórias bidimensionais 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função densidade de probabilidade • Uma função densidade de probabilidade f(x) pode ser usada para descrever a distribuição de probabilidades de uma variável aleatória contínua X. • A probabilidade de X estar entre a e b é determinada pela integral de f(x) entre a e b. f(x) P(a < x < b) a 04/11/2015 22:38 b x ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função densidade de probabilidade • Definição: Diz-se que f(x) é a função densidade de probabilidade da variável aleatória contínua X se a área limitada por f(x), o eixo dos x e as retas x = a e x = b for igual a P(a ≤ x ≤ b), isto é: b P ( a x b ) f ( x )dx a • Propriedades: 1. f ( x ) 0 para todo x 2. f ( x )dx 1 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função densidade de probabilidade • Observações: 1. A definição anterior mostra que a probabilidade de qualquer valor especificado de X, por exemplo xo, tem P(X = xo) = 0, pois P( X xo ) xo f ( x )dx 0 xo sendo assim, as probabilidades abaixo serão todas iguais, se X for uma variável aleatória contínua: P( a X b ) P( a X b ) P( a X b ) P( a X b ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função densidade de probabilidade • Observações: 2. Note-se que f(x), densidade de probabilidade, não é probabilidade. Somente quando a função for integrada entre dois limites, ela produzirá uma probabilidade, que será a área sob a curva função entre x = a e x = b, para a < b. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função densidade de probabilidade • Exemplo (Montgomery et al., 2001): Seja a variável aleatória contínua X a representação do diâmetro de um orifício perfurado em uma placa com um componente metálico. O diâmetro alvo é 12,5 mm. A maioria dos distúrbios aleatórios no processo resulta em diâmetros maiores. Dados históricos mostram que a distribuição de X pode ser modelada por uma função densidade de probabilidade f(x) = 20e-20(x – 12,5), x ≥ 12,5. (a) Se uma peça com diâmetro maior que 12,6 mm for descartada, qual será a proporção de peças descartadas? (b) Que proporção de peças está entre 12,5 e 12,6? 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função densidade de probabilidade • Solução: A função densidade e a probabilidade requerida são mostradas na figura abaixo. f(x) 12,5 12,6 04/11/2015 22:38 x ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função densidade de probabilidade • Solução (cont.): a) Uma peça é descartada se X > 12,6, logo: P ( X 12,6 ) 12 ,6 e 20 ( x 12 ,5 ) 20 e dx f ( x )dx 12 ,6 20 ( x 12 ,5 ) 12 ,6 0 ,135 b) Uma peça não é descartada se 12,5 < X < 12,6, logo: 12 ,6 P ( 12,5 X 12,6 ) 12 ,6 f ( x )dx 12 ,5 e 20 ( x 12 ,5 ) 04/11/2015 22:38 20e 20 ( x 12 ,5 ) dx 12 ,5 12 ,6 12 ,5 0 ,865 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função distribuição cumulativa • A função distribuição cumulativa de uma variável aleatória contínua X, com função densidade de probabilidade f(x) é: x F ( x ) P( X x ) f ( u )du para – ∞ < x < ∞. • Para uma variável aleatória contínua X, a definição pode também ser F(x) = P(X < x), pois P(X = x) = 0. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função distribuição cumulativa • A função distribuição cumulativa F(x) pode ser relacionada à função densidade de probabilidade f(x) e pode ser usada para obter probabilidades, como segue: b P( a X b ) f ( x )dx a b a f ( x )dx f ( x )dx F ( b ) F ( a ) • O gráfico de uma função distribuição cumulativa tem propriedades específicas. Pelo fato de F(x) fornecer probabilidades, ela é sempre positiva. Além disso, à medida que x aumenta, F(x) é crescente. Finalmente, quando x tende a ∞, F(x) = P(X ≤ x) tende a 1. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função distribuição cumulativa • Exemplo (Montgomery et al., 2001): As leituras da temperatura de um termopar em um forno flutuam de acordo com a função distribuição cumulativa 0 F ( x ) 0 , 1 x 80 0 x 800º C 800º C x 810º C x 810º C Determine: a) P(X < 805); b) P(800 < X ≤ 805); c) P(X > 808) d) Se as especificações para o processo solicitassem que a temperatura do forno estivesse entre 802ºC e 808ºC, qual seria a probabilidade da fornalha operar fora das especificações? 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.3 Variáveis Aleatórias Contínuas Função distribuição cumulativa • Solução: a) P( X 805) P( X 805) F ( 805) F ( ) 0 ,1 805 80 0 0 ,5 b) P( 800 X 805) F ( 805) F ( 800 ) 0 ,1 805 80 0 0 ,5 c) P( X 808 ) P( 808 X ) F ( ) F ( 808 ) 1 ( 0 ,1 808 80 ) 0 ,2 d) P( X 802) P( X 802) F ( 802) F ( ) 0 ,1 802 80 0 0 ,2 P( X 802 ou X 808 ) 0 ,2 0 ,2 0 ,4 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias III – Variáveis Aleatórias Introdução Varíáveis aleatórias discretas Variáveis aleatórias contínuas Parâmetros das variáveis aleatórias Variáveis aleatórias bidimensionais 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias Os parâmetros que caracterizam uma variável aleatória em termos médios (média e mediana), e em termos de dispersão (variância e desvio padrão), podem ser usados para resumir uma distribuição de probabilidades. a) Medidas de posição a.1) Média ou esperança matemática: Chama-se valor médio ou esperança matemática ao valor que se obtém somando (ou integrando) todos os valores que uma variável aleatória pode assumir, ponderados pela respectiva probabilidade pontual (ou densidade de probabilidade no ponto) e representa-se por μ = n E( X ) : E( X ) xi f ( xi ) ( caso discreto ) i 1 u E( X ) x f ( x )dx ( caso contínuo ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias a) Medidas de posição a.1) Média ou esperança matemática: - Propriedades: Serão demonstradas somente para o caso de variáveis discretas. 1. A média de uma constante é a própria constante E ( K ) Kf ( x i ) K f ( x i ) K i i 2. Multiplicando uma variável aleatória X por uma constante, sua média fica multiplicada por essa constante. E ( KX ) Kx i f ( x i ) K x i f ( x i ) KE ( X ) i 04/11/2015 22:38 i ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias a) Medidas de posição a.1) Média ou esperança matemática: - Propriedades: 3. A média da soma ou da diferença de duas variáveis aleatórias é a soma ou diferença das médias. E ( X Y ) ( x i x j ) f ( x i x j ) i j x i f ( x i y j ) y j f ( x i y j ) i j i j xi f ( xi y j ) y j f ( xi y j ) i j j i xi f ( xi ) y j f ( y j ) E( X ) E( Y ) i 04/11/2015 22:38 i ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias a) Medidas de posição a.1) Média ou esperança matemática: - Propriedades: 4. Somando ou subtraindo uma constante a uma variável aleatória, a sua média fica somada ou subtraída da mesma constante. E( X K ) E( X ) E( K ) E( X ) K 5. A média de uma variável aleatória centrada é zero. E( X X ) E( X ) E( X ) X X 0 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias a) Medidas de posição a.1) Média ou esperança matemática: - Propriedades: 6. A média do produto de duas variáveis aleatórias independentes é o produto das suas médias. E ( XY ) X i Y j f ( x i y j ) i j X i Y j f ( xi ) f ( y j ) i j X i F ( x i ) Y j f ( y j ) i pois X e Y são independentes j E( X ) E(Y ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias a) Medidas de posição a.2) Mediana: Mediana de uma variável aleatória é o valor que divide a distribuição em duas partes iguais, ou seja, F ( Md ) 0 ,5 • Exemplo: Seja X uma variável aleatória com a seguinte função distribuição cumulativa: F(X) = 0 F(X) = x2 F(X) = 1 para x < 0 para 0 ≤ x ≤ 1 para x > 1 Logo, a mediana será o valor de x tal que F(x = Md) = 0,5. Assim: 2 2 x Md 0,5 Md 0,5 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias a) Medidas de posição a.3) Moda: É o valor da variável aleatória com maior probabilidade, se X for discreta, ou maior densidade se X for contínua • Exemplo1: Seja X uma variável aleatória discreta tal que: x -1 0 2 P(x) 0,3 0,2 0,5 Logo, a moda será igual a 2. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias a) Medidas de posição a.3) Moda: • Exemplo 2: Seja X uma variável aleatória contínua tal que: 2 x f(x) 0 para 0 x 1 para outros valores de x O gráfico de f(x) é: f(x) Então: Moda: 2 M o 1; Md Mediana: 1 F ( Md ) 0 ,5 2 xdx 0 ,5 0 0 04/11/2015 22:38 1 x x2 Md 0 Md 2 0 ,5 Md ESTATÍSTICA APLICADA I - Variáveis Aleatórias 1 2 3.4 Parâmetros das Variáveis Aleatórias b) Medidas de dispersão b.1) Variância: A variância de uma variável aleatória X, representa-se por Var(X) = σx2 e define-se por: Var( X ) x2 E X E( X )2 x2 x E( X )2 f ( x ) 2 x ( caso discreto ) 2 x E ( X ) f ( x ) dx ( caso contínuo) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias b) Medidas de dispersão b.1) Variância: - Existe uma fórmula prática para o cálculo da variância: Var( X ) E( X 2 ) E( X ) 2 onde, E( X 2 ) x 2 f ( x ) ( caso discreto ) E( X ) 2 2 x f ( x ) dx ( caso contínuo ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias b) Medidas de dispersão b.2) Desvio padrão: Designa-se por desvio padrão e representa-se por σ a raiz quadrada positiva da variância: x Var( X ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.4 Parâmetros das Variáveis Aleatórias b) Medidas de dispersão - Propriedades: Sejam X e Y duas variáveis aleatórias e K, a e b constantes. 1. Var(k) = 0 2. Var(kX) = k2Var(X) 3. Var(aX ± bY ) = a2Var( X ) + b2Var( Y ) ± 2abCov(X,Y ) Caso as variáveis sejam independentes, Cov(X,Y ) = 0, então: Var( aX ± bY ) = a2Var( X ) + b2Var( Y ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias III – Variáveis Aleatórias Introdução Varíáveis aleatórias discretas Variáveis aleatórias contínuas Parâmetros das variáveis aleatórias Variáveis aleatórias bidimensionais 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Até aqui considerou-se que o resultado do experimento seria registrado como um único número x. Contudo, existem casos em que há interesse por dois resultados simultâneos. Por exemplo, estatura e peso de pessoas. Para isso precisa-se da seguinte definição: Sejam E um experimento aleatório e S o espaço amostral associado a E. Sejam X = X(s) e Y = Y(s), duas funções, cada uma associando um número real a cada resultado s ∈ S; denomina-se (X,Y) uma variável aleatória bidimensional. X s X(s) Y Y(s) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Uma variável aleatória bidimensional não é mais do que uma par de variáveis aleatórias (X,Y). No caso de X e Y serem duas variáveis aleatórias discretas, o par diz-se uma variável aleatória bidimensional discreta. Na situação em que ambas são contínuas tem-se uma variável aleatória bidimensional contínua. Portanto, tal como a variável unidimensional, (X,Y) poderá ser discreta ou contínua, valendo as mesmas considerações feitas anteriormente. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Função de probabilidade conjunta (V.A.D) • Chama-se função de probabilidade conjunta da variável aleatória bidimensional discreta (X,Y) à função f(x,y) que associa a cada elemento (x,y) a probabilidade da variável aleatória X assumir o valor x ao mesmo tempo da variável Y assumir o valor y . f (x,y) = P(X = x,Y = y) - Propriedades: 1. f ( x , y ) 0 2. f ( x i 04/11/2015 22:38 i , x R 2 ,yj ) 1 j ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Função de distribuição cumulativa conjunta (V.A.D) • Chama-se função de distribuição de probabilidade cumulativa conjunta da variável aleatória discreta (X,Y) à função F(x,y) que associa a cada elemento (x,y) a probabilidade da variável aleatória X tomar valores menores ou iguais a x ao mesmo tempo da variável Y tomar valores menores ou iguais a y. F ( x , y ) P ( X x ,Y y ) F( x, y ) f ( s , t ) s x t y 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Função de distribuição cumulativa conjunta (V.A.D) • Propriedades: 1. 0 F ( x , y ) 1 , 2. lim F ( x , y ) 1 x R 2 x y 3. lim F ( x , y ) 0 , y 4. lim F ( x , y ) 0 , x x y 5. x 1 x 2 ^ y 1 y 2 F ( x 1 , y 1 ) F ( x 2 , y 2 ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Funções de probabilidade marginal (V.A.D.) • Dada uma variável aleatória bidimensional discreta e sua função de distribuição conjunta, pode-se determinar a função de distribuição de X sem considerar Y, ou vice-versa. São as chamadas funções de probabilidade marginal. - Função de probabilidade marginal de X : f X ( x ) P( X x , Y ) P( X x ,Y y ) f ( x , y ) y y - Função de probabilidade marginal de Y : f Y ( y ) P( X ,Y y ) P( X x ,Y y ) f ( x , y ) x 04/11/2015 22:38 x ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Função densidade de probabilidade conjunta (V.A.C) • Tal como acontece nas variáveis unidimensionais contínuas, nas variáveis bidimensionais contínuas não faz sentido falar em função de probabilidade visto que P(X = x,Y = y) = 0 para qualquer (x,y), aparecendo em seu lugar a função de densidade de probabilidade conjunta. Esta função indica como a probabilidade se distribui pelos valores que o par aleatório (X,Y) pode assumir. • Seja X uma variável aleatória bidimensional contínua. Diz-se que f(x,y) é uma função densidade de probabilidade conjunta se: 2 1. f ( x , y ) 0 , ( x , y ) R 2. f ( x , y ) dx dy 1 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Função de distribuição cumulativa conjunta (V.A.C.) • Chama-se função de distribuição de probabilidade conjunta da variável aleatória contínua (X,Y) à função F(x,y) que associa a cada elemento (x,y) a probabilidade da variável aleatória X assumir valores menores ou iguais a x ao mesmo tempo da variável Y assumir valores menores ou iguais a y. • É definida como na variável aleatória unidimensional, assim: F ( x , y ) P ( X x ,Y y ) x y F( x, y ) f ( x , y ) dx dy 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Função de distribuição cumulativa conjunta (V.A.C.) • Propriedades: 1. 0 F ( x , y ) 1 , 2. lim F ( x , y ) 1 x R 2 x y 3. lim F ( x , y ) 0 , y 4. lim F ( x , y ) 0 , x x y 5. x 1 x 2 ^ y 1 y 2 F ( x 1 , y 1 ) F ( x 2 , y 2 ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Funções de probabilidade marginal (V.A.C.) • Dada uma variável aleatória bidimensional contínua e sua função densidade de probabilidade conjunta pode-se determinar a função densidade de probabilidade de X sem considerar Y, ou vice-versa. São as chamadas funções de probabilidade marginal. - Função de probabilidade marginal de X : fX ( x ) f ( x , y ) dy - Função de probabilidade marginal de Y : fY ( y ) f ( x , y ) dx 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Funções de (densidade de) probabilidade condicionais • Sabendo o valor que uma das variáveis vai assumir (ou assumiu) pode-se calcular a função de probabilidade (no caso discreto) ou a função de densidade de probabilidade (no caso contínuo) da outra variável, tendo em conta a informação conhecida relativamente ao valor da primeira variável. - Caso discreto e caso contínuo: f ( x, y ) f X |Y y ( x ) fY ( y ) f ( x, y ) fY |X x ( y ) fX ( x ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Covariância • No estudo das relações existentes entre duas variáveis aleatórias X e Y pode-se analisar a covariância das duas variáveis. Define-se, então, covariância entre X e Y, Cov(X,Y), como: Cov( X ,Y ) XY E X E( X ) Y E( Y ) - No caso discreto: Cov( X ,Y ) x E( X ) y E( Y ) f ( x , y ) x y - No caso contínuo: Cov( X ,Y ) x E( X ) y E( Y ) f ( x , y ) dx dy 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Covariância • Fórmula prática para o cálculo da covariância: Cov( X ,Y ) E ( X Y ) E ( X ) E ( Y ) - Verifica-se que: Cov( X ,Y ) 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Covariância • A covariância entre duas variáveis fornece uma medida da relação linear existente entre as duas variáveis: - Quando a covariância assume um valor muito alto positivo tem-se a indicação que existe uma relação linear positiva forte entre as duas variáveis. - Quando a covariância assume um valor muito baixo negativo tem-se a indicação que existe uma relação linear negativa forte. - Nas situações em que a covariância assume valores próximos de zero, a relação linear é muito fraca, e inexistente no caso em que a covariância é igual a zero. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Coeficiente de correlação linear • A covariância está expressa nas unidades das variáveis X e Y simultaneamente, o que introduz dificuldades quando se pretende fazer comparações. • Para evitar esta situação pode-se calcular o coeficiente de correlação linear (ρ) que tem sempre o seu valor entre –1 e 1. • Dado um par de variáveis aleatórias (X,Y), define-se coeficiente de correlação linear como: XY 04/11/2015 22:38 XY Var( X ) Var( Y ) X Y Cov( X ,Y ) ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Coeficiente de correlação linear • Quando: ρXY = −1, existe correlação linear negativa perfeita entre X e Y. ρXY = 0, não há correlação linear entreX e Y. ρXY = 1, existe correlação linear positiva perfeita entre X e Y. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Independência das variáveis aleatórias X e Y • Dada uma variável aleatória bidimensional (X,Y), diz-se que as variáveis unidimensionais que a integram, X e Y, são independentes, se a sua função (densidade) de probabilidade conjunta f(x,y), for igual ao produto das funções (densidade) de probabilidade marginais, isto é: X e Y são independentes se f ( x , y ) f ( x ) f ( y ) , ( x , y ) • Como consequência da definição tem-se que X e Y são independentes se e somente se f X |Y y ( x ) f X ( x ) ou 04/11/2015 22:38 fY | X x ( y ) fY ( y ) ESTATÍSTICA APLICADA I - Variáveis Aleatórias 3.5 Variáveis Aleatórias Bidimensionais Independência das variáveis aleatórias X e Y • Teorema: - Se duas variáveis aleatórias X e Y são independentes então a Cov(X,Y) = 0. - Nota: A recíproca não é verdadeira. Duas variáveis podem ter Cov(X,Y) = 0 e não serem independentes. Apenas podemos garantir que não existe relação linear entre as duas variáveis; no entanto, pode existir outro tipo de relação, que não a linear, e não serem independentes. 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias III – Variáveis Aleatórias FIM 04/11/2015 22:38 ESTATÍSTICA APLICADA I - Variáveis Aleatórias