MBA em Gestão de Projetos e Processos Organizacionais Estatística Aplicada Galo Lopez Noriega [email protected] 1 Variáveis Aleatórias e Distribuição Normal Bussab e Morettin: Capítulo 6 Levine: Capítulo 5 2 Variáveis Aleatórias Quando tomamos decisões em face da incerteza, raramente elas se baseiam apenas na probabilidade; na maioria dos casos, devemos também saber algo sobre as conseqüências potenciais da tomada de decisão (perdas, lucros, penalidades ou recompensas). Para decidir se compramos um carro novo, não basta sabermos que o carro velho em breve necessitará de reparos; para tomar uma decisão sensata, devemos saber, por exemplo, o custo dos reparos e o valor de troca do carro velho. 3 Variáveis Aleatórias Por exemplo, uma construtora precisa decidir se apresenta proposta para um projeto que lhe oferece a perspectiva de R$ 250.000,00 de lucro com probabilidade de 20% ou de um prejuízo de R$ 80.000,00 (eventualmente em conseqüência de uma crise financeira no país) com 80% de chance. A probabilidade da construtora ter lucro não é muito grande, mas a quantia que ela pode ganhar é muito maior do que a que ela pode perder. Este exemplo mostra a necessidade de um método que permita combinar probabilidades e conseqüências. 4 Tipos de Variáveis Aleatórias Variáveis Aleatórias Discretas Variáveis Aleatórias Contínuas Variável aleatória discreta: conjunto de possibilidades formado por números inteiros (finito ou infinito) Exemplo: idade (anos), nº de filhos Variável aleatória contínua: conjunto de possibilidades num intervalo ou conjuntos de intervalos contínuos Exemplo: tempo de duração, temperatura 5 Variáveis Aleatórias Discretas Uma indústria de aviões recebe pedidos de um determinado tipo de jato comercial por ano (X: 0, 1, 2, 3, 4, ...) Um empresário com 20 escritórios comerciais quer saber o número de escritórios que estão alugados por mês (X: 0, 1, 2, 3, ...., 20) Número de vendas num dia de funcionamento de uma loja (X: 0, 1, 2, ...) Número de chamadas telefônicas recebidas numa central num dia (X: 0,1, 2, ...) Um vendedor de seguros aborda 5 clientes por dia, recebendo 50,00 de comissão a cada venda. A variável de interesse é o ganho diário do vendedor (X: 0,00; 50,00; 100,00; 150,00; 200,00; 250,00) Número de peças defeituosas num lote com 30 peças (X: 0, 1,..., 30) Número de papéis que fecharam em alta ao final de um pregão (X: 0, 1, ..., n) 6 Variáveis Aleatórias Contínuas X – Cotação média do dólar ao final de um dia; Y – Tempo de execução de uma tarefa; Z – Nível de colesterol no sangue; T – Altura de trabalhadores de uma certa região. W – Tempo de espera em uma fila bancária: t0 U – Intenção de votos em um candidato em uma certa semana: 0 x 1 S – Variação do real frente ao dólar em um certo dia: - y + 7 Diferença Fundamental Uma diferença fundamental separa as variáveis aleatórias discretas e as contínuas em termos de probabilidade de cálculo. Para uma variável aleatória discreta, a função de probabilidade f(x) fornece a probabilidade de que a variável aleatória assuma um valor particular. Com as variáveis aleatórias contínuas a contraparte da função de probabilidade é a função densidade da probabilidade, também denotada por f(x). A diferença é que a função de densidade da probabilidade não fornece diretamente probabilidades. Contudo, a área sob o gráfico de f(x) que corresponde a um dado intervalo. Assim, quando calculamos as probabilidades para as variáveis aleatórias contínuas, estamos calculando a probabilidade de que a variável aleatória assuma qualquer 8 valor em um intervalo. Exemplo Considere a variável aleatória x, que representa o tempo de vôo de um avião United Airlines viajando do Chicago à Nova York. Suponha que o tempo de vôo pode ser qualquer valor no intervalo de 120 até 140 minutos. A variável aleatória x é discreta ou contínua? Como todos os intervalos de um minuto sendo igualmente prováveis, dizese que a variável aleatória x tem uma distribuição uniforme de probabilidade. A função de densidade da probabilidade que define a distribuição é: 1 1 para 120 x 140 f ( x ) b a 20 em qualquer outro lugar 0 Qual é a probabilidade de que o tempo de vôo esteja entre 120 e 130 minutos? Isso é, qual é P(120 x 130) 9 Área=base x altura Modelos Probabilísticos Discretos Distribuição de Bernoulli Distribuição Binomial Distribuição Geométrica Distribuição de Poisson 10 Modelos Probabilísticos Contínuos Distribuição Exponencial Distribuição Uniforme Distribuição Normal 11 Distribuição Normal 12 Johann Carl Friedrich Gauss Alemanha 1777-1855 13 http://www-gap.dcs.st-and.ac.uk/~history/Mathematicians/Gauss.html Distribuição Normal E(X) Var(X) 3 2 3 2 2 14 Introdução à Distribuição Normal Considere os dados relativos às alturas de um grupo de 500 crianças de oito anos de idade. Altura (cm ) de 100 a 110 de 110 a 120 de 120 a 130 de 130 a 140 de 140 a 150 de 150 a 160 de 160 a 170 Freqüência 20 48 100 170 98 44 20 15 Introdução à Distribuição Normal Plotando estas informações em um histograma, temos alguma idéia da distribuição das alturas entre as crianças de oito anos. 100 110 120 130 140 150 160 170 16 Introdução à Distribuição Normal “Qual é a probabilidade de que uma criança de oito anos selecionada aleatoriamente tenha mais de 160 cm de altura?” A partir do gráfico, pode-se ver que 20 crianças das 500 têm mais de 160 cm de altura. Isso fornece uma probabilidade de 20/500=0,04. “Qual é a probabilidade de uma criança de oito anos escolhida aleatoriamente tenha mais de 163 cm de altura?” Se as bandas dos grupos fossem menores, o histograma mudaria um pouco, como mostra a figura a seguir. 17 F r e q u ê n c i a Altura Mais interessante ainda: A distribuição das alturas é simétrica; A maioria dos valores agrupa-se em torno do centro (a média) Os valores vão se tornando cada vez menos prováveis, quanto 18 mais distantes eles se encontram da média. Medindo as alturas de mais e mais crianças de oito anos e tomando intervalos de grupos menores, o histograma se aproximaria de uma curva simétrica suave em forma de sino chamado de curva ou distribuição normal. F r e q u ê n c i a Altura 19 Medindo as alturas de mais e mais crianças de oito anos e tomando intervalos de grupos menores, o histograma se aproximaria de uma curva simétrica suave em forma de sino chamado de curva ou distribuição normal. F r e q u ê n c i a Altura 20 A Distribuição Normal Uma das principais distribuições de probabilidades para variáveis contínuas é a distribuição normal. A distribuição normal fica perfeitamente caracterizada por meio da média e do desvio padrão . O gráfico da distribuição normal assemelha-se a um sino. 21 Distribuição Normal • Esta distribuição encontra-se tabelada, sendo que esta tabela informa a prob (0 z a) 3 2 Propriedades da distribuição normal: prob(z>0) = prob(z<0) = 50% prob(z>a) = 0,5 - prob(0<z<a) se a>0 prob(z<a) = 0,5 - prob(0<z<a) se a<0 3 2 23 Desenhar os gráficos Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.1 0.2 0.3 0.4 .0000 .0398 .0793 .1179 .1554 .0040 .0438 .0832 .1217 .1591 .0080 .0478 .0871 .1255 .1628 .0120 .0517 .0910 .1293 .1664 .0160 .0557 .0948 .1331 .1700 .0199 .0596 .0987 .1368 .1736 0.239 .0636 .1026 .1406 .1772 .0279 .0675 .1064 .1443 .1808 .0319 .0714 .1103 .1480 .1844 0.359 .0753 .1141 .1517 .1879 0.5 0.6 0.7 0.8 0.9 .1915 .2257 .2580 .2881 .3159 .1950 .2291 .2612 .2910 .3186 .1985 .2324 .2642 .2939 .3212 .2019 .2357 .2673 .2967 .3238 .2054 .2389 .2704 .2995 .3264 .2088 .2422 .2734 .3023 .3289 .2123 .2454 .2764 .3051 .3315 .2157 .2486 .2794 .3078 .3340 .2190 .2518 .2823 .3106 .3365 .2224 .2549 .2852 .3133 .3389 1.0 1.1 1.2 1.3 1.4 .3413 .3643 .3849 .4032 .4192 .3438 .3665 .3869 .4049 .4207 .3461 .3686 .3888 .4066 .4222 .3485 .3708 .3907 .4082 .4236 .3508 .3729 .3925 .4099 .4251 .3531 .3749 .3944 .4115 .4265 .3554 .3770 .3962 .4131 .4279 .3577 .3790 .3980 .4147 .4292 .3599 .3810 .3997 .4162 .4306 .3621 .3830 .4015 .4177 .4319 1.5 1.6 1.7 1.8 1.9 .4332 .4452 .4554 .4641 .4713 .4345 .4463 .4564 .4649 .4719 .4357 .4474 .4573 .4656 .4726 .4370 .4484 .4582 .4664 .4732 .4382 .4495 .4591 .4671 .4738 .4394 .4505 .4599 .4678 .4744 .4406 .4515 .4608 .4686 .4750 .4418 .4525 .4616 .4693 .4756 .4429 .4535 .4625 .4699 .4761 .4441 .4545 .4633 .4706 .4767 2.0 2.1 2.2 2.3 2.4 .4772 .4821 .4861 .4893 .4918 .4778 .4826 .4864 .4896 .4920 .4783 .4830 .4868 .4898 .4922 .4788 .4834 .4871 .4901 .4925 .4793 .4838 .4875 .4904 .4927 .4798 .4842 .4878 .4906 .4929 .4803 .4846 .4881 .4909 .4931 .4808 .4850 .4884 .4911 .4932 .4812 .4854 .4887 .4913 .4934 .4817 .4857 .4890 .4916 .4936 2.5 2.6 2.7 2.8 2.9 .4938 .4953 .4965 .4974 .4981 .4940 .4955 .4966 .4975 .4982 .4941 .4956 .4967 .4976 .4982 .4943 .4957 .4968 .4977 .4983 .4945 .4959 .4969 .4977 .4984 .4946 .4960 .4970 .4978 .4984 .4948 .4961 .4971 .4979 .4985 .4949 .4962 .4972 .4979 .4985 .4951 .4963 .4973 .4980 .4986 .4952 .4964 .4974 .4981 .4986 3.0 .4986 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 24 .4990 Vamos ver se você entendeu... • Seja Z:N(=0, =1), calcule: a) Prob(0<z<1,3) b) Prob(0<z<2,4) c) Prob(z>2,5) d) Prob(1,5<z<2,8) 25 a) Prob(0<z<1,3) 0 1,3 Z 0 1,3 Z 26 b) Prob(0<z<2,4) 0 2,4 Z 27 c) Prob(z>2,5) 0 2,5 Z 0 2,5 Z 28 d) Prob(1,5<z<2,8) 0 1,5 Z 2,8 29 d) Prob(1,5<z<2,8) 0 1,5 Z 2,8 30 d) Prob(1,5<z<2,8) 0 1,5 Z 2,8 31 d) Prob(1,5<z<2,8) 0 1,5 Z 2,8 32 Para você praticar... e) Prob(z>2,96) f) Prob(-1,3<z<0) g) Prob(-1,5<z<-1) h) Prob(-1,75<z<2,3) 33 Respostas a) 0,4032 b) 0,4918 c) 0,5-0,4938 = 0,0062 d) 0,4974 - 0,4332 = 0,0642 e) 0,5 - 0,4985 = 0,0015 f) 0,4032 g) 0,4332 - 0,3413 = 0,0919 h) 0,4893 + 0,4599 = 0,9492 34 Para pensar... Hummm.... Mas os nossos problemas na vida real são sempre com a média igual a zero e o desvio padrão igual a 1 ? 35 Convertendo à Distribuição Normal Padrão Se X é uma variável aleatória com média e desvio padrão , então: Z X É uma distribuição normal padrão com média =0 e desvio padrão =1 36 E como fica o Modelo Matemático?? A função de densidade da probabilidade de uma variável normal padronizada é: 1 (1/ 2) Z 2 f (Z ) e 2 37 Exemplos Seja X uma variável com distribuição normal com média = 4 e desvio padrão = 5. Calcule: a) Prob(6<x<8) b) Prob(-1<x<9) c) Prob(-6<x<14) 38 64 84 a) prob(6 x 8) prob( z ) 5 5 prob(0,4 z 0,8) 0,2881 0,1554 0,1372 13,72% 1 4 94 b) prob(1 x 9) prob( z ) 5 5 prob(1 z 1) 0,3413 0,3413 0,6826 68,26% 64 14 4 c) prob(6 x 14) prob( z ) 5 5 prob(2 z 2) 0,4772 0,4772 0,9544 95,44% 39 Seja X uma variável aleatória com média e desvio padrão . a. Prob (– < x + ) b. Prob (–2 < x +2) c. Prob (– 3 < x +3) 3 2 3 2 40 Resolução do item a prob( x ) prob( z ) prob( z ) prob(1 z 1) 68,26% Interpretação: Isto significa que a probabilidade de x estar entre a média menos um desvio e a média mais um desvio é de 68,26%, independentemente do valor da média e do desvio. Assim, se um determidado produto tem média 500 e desvio 5 , então 68,26% dos produtos se encontram no intervalo 495 a 505. 41 Resolução do item b 2 2 prob( 2 x 2 ) prob( z ) 2 2 prob( z ) prob(2 z 2) 95,44% Interpretação: Isto significa que a probabilidade de x estar entre a média menos dois desvios e a média mais dois desvios é de 95,44%, independentemente do valor da média e do desvio. Assim, se um determidado produto tem média 500 e desvio 5 , então 95,44% dos produtos se 42 encontram no intervalo 490 a 510. Resolução do item c 3 3 prob( 3 x 3 ) prob( z ) 3 3 prob( z ) prob(3 z 3) 99,72% Interpretação: Isto significa que a probabilidade de x estar entre a média menos 3 desvios e a média mais 3 desvios é de 99,72%, independentemente do valor da média e do desvio. Assim, se um determidado produto tem média 500 e desvio 5 , então 99,72% dos produtos se encontram no intervalo 485 a 515. 43 Áreas sob a curva para qualquer distribuição normal de probabilidade 3 2 2 3 68% 95% 99,7% 44 Adicionalmente, Prob (– 1,96 < x +1,96) 45 1,96 1,96 prob( 1,96 x 1,96 ) prob( z ) 1,96 1,96 prob( z ) prob(1,96 z 1,96) 95% Interpretação: Isto significa que a probabilidade de x estar entre a média menos 1,96 desvios e a média mais 1,96 desvios é de 95%, independentemente do valor da média e do desvio. Assim, se um determidado produto tem média 500 e desvio 5 , então 95% dos produtos se encontram no intervalo 490,2 a 509,8. 46 Problema Um consultor está investigando o tempo que os trabalhadores de uma fábrica de automóveis levam para montar determinada peça depois de terem sido treinados para realizar a tarefa por um método de aprendizagem individual. O consultor determina que o tempo em segundos para montar a peça para os trabalhadores treinados por esse método é distribuído de maneira normal com média aritmética de 75 segundos e desvio padrão de 6 segundos. 47 Problema 1. Qual é a probabilidade de que um trabalhador da fábrica escolhido aleatoriamente possa montar uma peça em menos de 75 segundos ou em mais de 81 segundos. 2. Qual é a probabilidade de que um trabalhador da fábrica escolhido aleatoriamente possa montar uma peça entre 69 e 81 segundos. 3. Qual é a probabilidade de que um trabalhador da fábrica escolhido aleatoriamente possa montar uma peça em menos de 62 segundos. 48 Problema 4. Qual é a probabilidade de que um trabalhador da fábrica escolhido aleatoriamente possa montar uma peça entre 62 e 69 segundos. 5. Quantos segundos devem transcorrer antes que 50% dos trabalhadores da fábrica montem uma peça. 6. Quantos segundos devem transcorrer antes que 10% dos trabalhadores da fábrica montem uma peça. 49 Toda medida de X possui uma medida padronizada correspondente Z Transformação de escalas 3 2 1 1 2 3 57 63 69 75 81 87 93 Escala X (µ=75, =6) -3 -2 -1 0 +1 +2 +3 Escala Z 50 Questão 1: P(X <75 ou X > 81) Z 75 6 Z X Área=0,3413 X 81 75 1,00 6 A Probabilidade é 0,5000 + 0,1587 = 0,6587 75 75 0,00 6 Área=0,5000 Área=0,1587 57 62 69 75 81 87 93 X -3 -2 -1 0 1 2 3 Z 51 Questão 2: P(69 ≤ X ≤ 81) 75 6 Z Z X 69 75 1,00 6 X 81 75 1,00 6 Área=0,3413 Área=0,3413 A Probabilidade é 0,3413 + 0, 3413 = 0,6826 57 62 69 75 81 87 93 X -3 -2 -1 0 1 2 3 Z 52 Questão 3: P(X < 62) 62 75 13 Z 2,17 6 6 Area = 0,4850 A Probabilidade é 0,5000 - 0,4850 = 0,0150 53 Questão 4: P(62 ≤ X ≤ 69) Z 62 75 2,17 6 Area 0,4850 Z 69 75 1,00 6 Area 0,3413 A Probabilidade é 0,4850 – 0,3413 = 0,1437 54 Questão 5 Quantos segundos devem transcorrer antes que 50% dos trabalhadores da fábrica montem uma peça. A Área é 0,5000 A Área é 0,5000 57 62 69 75 81 87 93 X -3 -2 -1 0 1 2 3 Z 55 Questão 6 Quantos segundos devem transcorrer antes que 10% dos trabalhadores da fábrica montem uma peça. A Área é 0,4000 A Área é 0,5000 A Área é 0,1000 57 62 69 75 81 87 93 X -3 -2 -1 0 1 2 3 Z 56 Questão 6 Quantos segundos devem transcorrer antes que 10% dos trabalhadores da fábrica montem uma peça. Z A Área é 0,4000 X X Z X ( 1,28) (6) 75 A Área é 0,1000 X 67,32seg Z = 1,28 57 62 69 75 81 87 93 X -3 -2 -1 0 1 2 3 Z 57 Caso: O problema da Companhia Grear Tire 1) Suponha que Companhia Grear Tire acabou de desenvolver um novo pneu radial cintado em aço e será vendido com desconto através de uma cadeia nacional de lojas. Como o pneu é um novo produto, os gerentes da Grear acreditam que a garantia de quilometragem oferecida com o pneu será um fator importante na aceitação do produto. Antes de concluírem a política de garantia de quilometragem, os gerentes da Grear desejam informações de probabilidade sobre o número de quilômetros em que os pneus se gastarão. A partir de testes reais com os pneus em auto-estrada, o grupo de engenharia da Grear estimou a quilometragem média do pneu em = 36500 quilômetros e o desvio-padrão = 5000. Além disso os dados coletados indicam que a distribuição normal é uma hipótese 58 razoável. Caso: O problema da Companhia Grear Tire Qual a porcentagem dos pneus que apresenta expectativa de durar mais de 40000 quilômetros? Vamos agora assumir que a Grear está considerando uma garantia que fornecerá um desconto na substituição dos pneus se os orginais não excederem a quilometragem declarada na garantia. Qual deveria ser a quilometragem de garantia se a Grear não quer mais do que 10% dos pneus qualificados elegíveis para a garantia de desconto? Entregar exercício, na próxima aula, em grupos de até 3 alunos. 59 Exercícios de hoje 2) O tempo médio que um assinante gasta lendo The Wall Street Journal é de 49 minutos. Considere que o desviopadrão seja 16 minutos e que os tempos sejam distribuídos normalmente. a) Qual é a probabilidade de que um assinante gastará pelo menos 1 hora lendo o jornal? b) Qual é a probabilidade de que um assinante gastará não mais do que 30 minutos lendo o jornal? c) Para os 10% que gastam o maior tempo lendo o jornal, quanto tempo isso representa? Entregar exercício, na próxima aula, em grupos de até 3 alunos. 60 Exercícios de hoje 3) O volume de comercialização na Bolsa de Valores de Nova York tem crescido nos últimos anos. Para as duas primeiras semanas de janeiro de 1998, o volume médio diário foi cerca de 646 milhões de ações. A distribuição de probabilidade do volume diário é aproximadamente normal com um desvio-padrão de cerca de 100 milhões de ações. a) Qual é a probabilidade de que o volume de comercialização será menor do que 400 milhões de ações? b) Durante que porcentagem de tempo o volume de comercialização excedeu 800 milhões de ações? c) Se a Bolsa quer emitir um press release sobre os 5% de dias de comercialização de pico,qual volume acionará o release? Entregar exercício, na próxima aula, em grupos de até 3 alunos. 61