MBA em Gestão de Projetos e
Processos Organizacionais
Estatística Aplicada
Galo Lopez Noriega
[email protected]
1
Variáveis Aleatórias e
Distribuição Normal
Bussab e Morettin: Capítulo 6
Levine: Capítulo 5
2
Variáveis Aleatórias
Quando tomamos decisões em face da incerteza,
raramente elas se baseiam apenas na probabilidade; na
maioria dos casos, devemos também saber algo sobre
as conseqüências potenciais da tomada de decisão
(perdas, lucros, penalidades ou recompensas).
Para decidir se compramos um carro novo, não basta
sabermos que o carro velho em breve necessitará de
reparos; para tomar uma decisão sensata, devemos
saber, por exemplo, o custo dos reparos e o valor de
troca do carro velho.
3
Variáveis Aleatórias
Por exemplo, uma construtora precisa decidir se apresenta
proposta para um projeto que lhe oferece a perspectiva de
R$ 250.000,00 de lucro com probabilidade de 20% ou de
um prejuízo de R$ 80.000,00 (eventualmente em
conseqüência de uma crise financeira no país) com 80% de
chance. A probabilidade da construtora ter lucro não é
muito grande, mas a quantia que ela pode ganhar é muito
maior do que a que ela pode perder.
Este exemplo mostra a necessidade de um método que
permita combinar probabilidades e conseqüências.
4
Tipos de Variáveis Aleatórias
 Variáveis Aleatórias Discretas
 Variáveis Aleatórias Contínuas
Variável aleatória discreta: conjunto de possibilidades
formado por números inteiros (finito ou infinito)
Exemplo: idade (anos), nº de filhos
Variável aleatória contínua: conjunto de possibilidades num
intervalo ou conjuntos de intervalos contínuos
Exemplo: tempo de duração, temperatura
5
Variáveis Aleatórias Discretas
 Uma indústria de aviões recebe pedidos de um determinado tipo de jato
comercial por ano (X: 0, 1, 2, 3, 4, ...)
 Um empresário com 20 escritórios comerciais quer saber o número de
escritórios que estão alugados por mês (X: 0, 1, 2, 3, ...., 20)
 Número de vendas num dia de funcionamento de uma loja (X: 0, 1, 2, ...)
 Número de chamadas telefônicas recebidas numa central num dia
(X: 0,1, 2, ...)
 Um vendedor de seguros aborda 5 clientes por dia, recebendo 50,00 de
comissão a cada venda. A variável de interesse é o ganho diário do
vendedor (X: 0,00; 50,00; 100,00; 150,00; 200,00; 250,00)
 Número de peças defeituosas num lote com 30 peças (X: 0, 1,..., 30)
 Número de papéis que fecharam em alta ao final de um pregão
(X: 0, 1, ..., n)
6
Variáveis Aleatórias Contínuas
 X – Cotação média do dólar ao final de um dia;
 Y – Tempo de execução de uma tarefa;
 Z – Nível de colesterol no sangue;
 T – Altura de trabalhadores de uma certa região.
 W – Tempo de espera em uma fila bancária: t0
 U – Intenção de votos em um candidato em uma certa
semana: 0  x  1
 S – Variação do real frente ao dólar em um certo dia:
- y  +
7
Diferença Fundamental
Uma diferença fundamental separa as variáveis aleatórias
discretas e as contínuas em termos de probabilidade de
cálculo. Para uma variável aleatória discreta, a função de
probabilidade f(x) fornece a probabilidade de que a variável
aleatória assuma um valor particular. Com as variáveis
aleatórias contínuas a contraparte da função de probabilidade
é a função densidade da probabilidade, também denotada por
f(x). A diferença é que a função de densidade da
probabilidade não fornece diretamente probabilidades.
Contudo, a área sob o gráfico de f(x) que corresponde a um
dado intervalo. Assim, quando calculamos as probabilidades
para as variáveis aleatórias contínuas, estamos calculando a
probabilidade de que a variável aleatória assuma qualquer
8
valor em um intervalo.
Exemplo
Considere a variável aleatória x, que representa o tempo de vôo de um
avião United Airlines viajando do Chicago à Nova York. Suponha que o
tempo de vôo pode ser qualquer valor no intervalo de 120 até 140
minutos.
A variável aleatória x é discreta ou contínua?
Como todos os intervalos de um minuto sendo igualmente prováveis, dizese que a variável aleatória x tem uma distribuição uniforme de
probabilidade. A função de densidade da probabilidade que define a
distribuição é:
1
 1

para 120  x  140

f ( x )   b  a 20

em qualquer outro lugar
0
Qual é a probabilidade de que o tempo de vôo esteja entre 120 e 130
minutos? Isso é, qual é P(120  x  130)
9
Área=base x altura
Modelos Probabilísticos Discretos
Distribuição de Bernoulli
Distribuição Binomial
Distribuição Geométrica
Distribuição de Poisson
10
Modelos Probabilísticos Contínuos
Distribuição Exponencial
Distribuição Uniforme
Distribuição Normal
11
Distribuição
Normal
12
Johann Carl Friedrich Gauss
Alemanha 1777-1855
13
http://www-gap.dcs.st-and.ac.uk/~history/Mathematicians/Gauss.html
Distribuição Normal
E(X)  
Var(X)  
  3
  2



  3
  2
2
14
Introdução à Distribuição
Normal
Considere os dados relativos às alturas de um grupo de 500 crianças
de oito anos de idade.
Altura (cm )
de 100 a 110
de 110 a 120
de 120 a 130
de 130 a 140
de 140 a 150
de 150 a 160
de 160 a 170
Freqüência
20
48
100
170
98
44
20
15
Introdução à Distribuição
Normal
Plotando estas informações em um histograma, temos alguma idéia
da distribuição das alturas entre as crianças de oito anos.
100
110
120
130
140
150
160
170
16
Introdução à Distribuição
Normal
“Qual é a probabilidade de que uma criança de oito anos
selecionada aleatoriamente tenha mais de 160 cm de altura?”
A partir do gráfico, pode-se ver que 20 crianças das 500 têm mais de
160 cm de altura. Isso fornece uma probabilidade de 20/500=0,04.
“Qual é a probabilidade de uma criança de oito anos escolhida
aleatoriamente tenha mais de 163 cm de altura?”
Se as bandas dos grupos fossem menores, o histograma mudaria um
pouco, como mostra a figura a seguir.
17
F
r
e
q
u
ê
n
c
i
a
Altura
Mais interessante ainda:
 A distribuição das alturas é simétrica;
 A maioria dos valores agrupa-se em torno do centro (a média)
 Os valores vão se tornando cada vez menos prováveis, quanto
18
mais distantes eles se encontram da média.
Medindo as alturas de mais e mais crianças de oito anos e tomando
intervalos de grupos menores, o histograma se aproximaria de uma
curva simétrica suave em forma de sino chamado de curva ou
distribuição normal.
F
r
e
q
u
ê
n
c
i
a
Altura
19
Medindo as alturas de mais e mais crianças de oito anos e tomando
intervalos de grupos menores, o histograma se aproximaria de uma
curva simétrica suave em forma de sino chamado de curva ou
distribuição normal.
F
r
e
q
u
ê
n
c
i
a
Altura
20
A Distribuição Normal
Uma das principais distribuições de probabilidades para
variáveis contínuas é a distribuição normal. A distribuição
normal fica perfeitamente caracterizada por meio da
média  e do desvio padrão . O gráfico da distribuição
normal assemelha-se a um sino.
21
Distribuição Normal
• Esta distribuição encontra-se tabelada, sendo que esta tabela informa a
prob (0  z  a)
  3
  2



Propriedades da distribuição normal:
prob(z>0) = prob(z<0) = 50%
prob(z>a) = 0,5 - prob(0<z<a) se a>0
prob(z<a) = 0,5 - prob(0<z<a) se a<0
  3
  2
23
Desenhar os gráficos
Z
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
0.0
0.1
0.2
0.3
0.4
.0000
.0398
.0793
.1179
.1554
.0040
.0438
.0832
.1217
.1591
.0080
.0478
.0871
.1255
.1628
.0120
.0517
.0910
.1293
.1664
.0160
.0557
.0948
.1331
.1700
.0199
.0596
.0987
.1368
.1736
0.239
.0636
.1026
.1406
.1772
.0279
.0675
.1064
.1443
.1808
.0319
.0714
.1103
.1480
.1844
0.359
.0753
.1141
.1517
.1879
0.5
0.6
0.7
0.8
0.9
.1915
.2257
.2580
.2881
.3159
.1950
.2291
.2612
.2910
.3186
.1985
.2324
.2642
.2939
.3212
.2019
.2357
.2673
.2967
.3238
.2054
.2389
.2704
.2995
.3264
.2088
.2422
.2734
.3023
.3289
.2123
.2454
.2764
.3051
.3315
.2157
.2486
.2794
.3078
.3340
.2190
.2518
.2823
.3106
.3365
.2224
.2549
.2852
.3133
.3389
1.0
1.1
1.2
1.3
1.4
.3413
.3643
.3849
.4032
.4192
.3438
.3665
.3869
.4049
.4207
.3461
.3686
.3888
.4066
.4222
.3485
.3708
.3907
.4082
.4236
.3508
.3729
.3925
.4099
.4251
.3531
.3749
.3944
.4115
.4265
.3554
.3770
.3962
.4131
.4279
.3577
.3790
.3980
.4147
.4292
.3599
.3810
.3997
.4162
.4306
.3621
.3830
.4015
.4177
.4319
1.5
1.6
1.7
1.8
1.9
.4332
.4452
.4554
.4641
.4713
.4345
.4463
.4564
.4649
.4719
.4357
.4474
.4573
.4656
.4726
.4370
.4484
.4582
.4664
.4732
.4382
.4495
.4591
.4671
.4738
.4394
.4505
.4599
.4678
.4744
.4406
.4515
.4608
.4686
.4750
.4418
.4525
.4616
.4693
.4756
.4429
.4535
.4625
.4699
.4761
.4441
.4545
.4633
.4706
.4767
2.0
2.1
2.2
2.3
2.4
.4772
.4821
.4861
.4893
.4918
.4778
.4826
.4864
.4896
.4920
.4783
.4830
.4868
.4898
.4922
.4788
.4834
.4871
.4901
.4925
.4793
.4838
.4875
.4904
.4927
.4798
.4842
.4878
.4906
.4929
.4803
.4846
.4881
.4909
.4931
.4808
.4850
.4884
.4911
.4932
.4812
.4854
.4887
.4913
.4934
.4817
.4857
.4890
.4916
.4936
2.5
2.6
2.7
2.8
2.9
.4938
.4953
.4965
.4974
.4981
.4940
.4955
.4966
.4975
.4982
.4941
.4956
.4967
.4976
.4982
.4943
.4957
.4968
.4977
.4983
.4945
.4959
.4969
.4977
.4984
.4946
.4960
.4970
.4978
.4984
.4948
.4961
.4971
.4979
.4985
.4949
.4962
.4972
.4979
.4985
.4951
.4963
.4973
.4980
.4986
.4952
.4964
.4974
.4981
.4986
3.0
.4986
.4987
.4987
.4988
.4988
.4989
.4989
.4989
.4990
24
.4990
Vamos ver se você entendeu...
• Seja Z:N(=0, =1), calcule:
a) Prob(0<z<1,3)
b) Prob(0<z<2,4)
c) Prob(z>2,5)
d) Prob(1,5<z<2,8)
25
a) Prob(0<z<1,3)
0
1,3
Z
0
1,3
Z
26
b) Prob(0<z<2,4)
0
2,4
Z
27
c) Prob(z>2,5)
0
2,5
Z
0
2,5
Z
28
d) Prob(1,5<z<2,8)
0
1,5
Z
2,8
29
d) Prob(1,5<z<2,8)
0
1,5
Z
2,8
30
d) Prob(1,5<z<2,8)
0
1,5
Z
2,8
31
d) Prob(1,5<z<2,8)
0
1,5
Z
2,8
32
Para você praticar...
e) Prob(z>2,96)
f) Prob(-1,3<z<0)
g) Prob(-1,5<z<-1)
h) Prob(-1,75<z<2,3)
33
Respostas
a) 0,4032
b) 0,4918
c) 0,5-0,4938 = 0,0062
d) 0,4974 - 0,4332 = 0,0642
e) 0,5 - 0,4985 = 0,0015
f) 0,4032
g) 0,4332 - 0,3413 = 0,0919
h) 0,4893 + 0,4599 = 0,9492
34
Para pensar...
Hummm.... Mas os nossos
problemas na vida real são sempre
com a média igual a zero e o desvio
padrão igual a 1 ?
35
Convertendo à Distribuição
Normal Padrão
Se X é uma variável aleatória com média  e
desvio padrão , então:
Z
X 

É uma distribuição normal padrão com média
 =0 e desvio padrão  =1
36
E como fica o Modelo
Matemático??
A função de densidade da probabilidade de uma variável
normal padronizada é:
1 (1/ 2) Z 2
f (Z ) 
e
2
37
Exemplos
Seja X uma variável com distribuição normal com
média  = 4 e desvio padrão = 5. Calcule:
a) Prob(6<x<8)
b) Prob(-1<x<9)
c) Prob(-6<x<14)
38
64
84
a) prob(6  x  8)  prob(
z
)
5
5
prob(0,4  z  0,8)  0,2881 0,1554 0,1372 13,72%
1  4
94
b) prob(1  x  9)  prob(
z
)
5
5
prob(1  z  1)  0,3413 0,3413 0,6826 68,26%
64
14  4
c) prob(6  x  14)  prob(
z
)
5
5
prob(2  z  2)  0,4772 0,4772 0,9544 95,44%
39
Seja X uma variável aleatória com média  e desvio padrão .
a. Prob (–  < x + )
b. Prob (–2  < x +2)
c. Prob (– 3 < x +3)
  3
  2
  
  3
  2
40
Resolução do item a
prob(     x     )  prob(

   
   
z
)



 prob(
 z  )  prob(1  z  1)  68,26%


Interpretação:
Isto significa que a probabilidade de x estar entre a
média menos um desvio e a média mais um desvio é de
68,26%, independentemente do valor da média e do
desvio. Assim, se um determidado produto tem média 500
e desvio 5 , então 68,26% dos produtos se encontram no
intervalo 495 a 505.
41
Resolução do item b
  2  
  2  
prob(   2  x    2 )  prob(
z
)


 2
2
 prob(
z
)  prob(2  z  2)  95,44%


Interpretação:
Isto significa que a probabilidade de x estar entre a
média menos dois desvios e a média mais dois desvios
é de 95,44%, independentemente do valor da média e
do desvio. Assim, se um determidado produto tem
média 500 e desvio 5 , então 95,44% dos produtos se
42
encontram no intervalo 490 a 510.
Resolução do item c
  3  
  3  
prob(   3  x    3 )  prob(
z
)


 3
3
 prob(
z
)  prob(3  z  3)  99,72%


Interpretação:
Isto significa que a probabilidade de x estar entre a
média menos 3 desvios e a média mais 3 desvios é de
99,72%, independentemente do valor da média e do
desvio. Assim, se um determidado produto tem média
500 e desvio 5 , então 99,72% dos produtos se
encontram no intervalo 485 a 515.
43
Áreas sob a curva para qualquer distribuição
normal de probabilidade

  3   2
 

 
  2
  3
68%
95%
99,7%
44
Adicionalmente,
Prob (– 1,96 < x +1,96)
45
  1,96  
  1,96  
prob(   1,96  x    1,96 )  prob(
z
)


 1,96
1,96
 prob(
z
)  prob(1,96  z  1,96)  95%


Interpretação:
Isto significa que a probabilidade de x estar entre a
média menos 1,96 desvios e a média mais 1,96 desvios
é de 95%, independentemente do valor da média e do
desvio. Assim, se um determidado produto tem média
500 e desvio 5 , então 95% dos produtos se encontram
no intervalo 490,2 a 509,8.
46
Problema
Um consultor está investigando
o tempo que os
trabalhadores de uma fábrica de automóveis levam para
montar determinada peça depois de terem sido treinados
para realizar a tarefa por um método de aprendizagem
individual.
O consultor determina que o tempo em segundos para
montar a peça para os trabalhadores treinados por esse
método é distribuído de maneira normal com média
aritmética  de 75 segundos e desvio padrão  de
6 segundos.
47
Problema
1. Qual é a probabilidade de que um trabalhador da
fábrica escolhido aleatoriamente possa montar uma
peça em menos de 75 segundos ou em mais de 81
segundos.
2. Qual é a probabilidade de que um trabalhador da
fábrica escolhido aleatoriamente possa montar uma
peça entre 69 e 81 segundos.
3. Qual é a probabilidade de que um trabalhador da
fábrica escolhido aleatoriamente possa montar uma
peça em menos de 62 segundos.
48
Problema
4. Qual é a probabilidade de que um trabalhador da fábrica
escolhido aleatoriamente possa montar uma peça entre
62 e 69 segundos.
5. Quantos segundos devem transcorrer antes que 50%
dos trabalhadores da fábrica montem uma peça.
6. Quantos segundos devem transcorrer antes que 10%
dos trabalhadores da fábrica montem uma peça.
49
Toda medida de X possui uma medida
padronizada correspondente Z
Transformação de escalas
3
2
1

1
2
3
57
63
69
75
81
87
93
Escala X
(µ=75, =6)
-3
-2
-1
0
+1
+2
+3
Escala Z
50
Questão 1: P(X <75 ou X > 81)
Z
  75
 6
Z
X 
Área=0,3413
X 


81  75
 1,00
6
A Probabilidade é
0,5000 + 0,1587 = 0,6587
75  75

 0,00
6

Área=0,5000
Área=0,1587
57
62
69
75
81
87
93
X
-3
-2
-1
0
1
2
3
Z
51
Questão 2: P(69 ≤ X ≤ 81)
  75
 6
Z
Z
X 


69  75
 1,00
6
X 


81  75
 1,00
6
Área=0,3413
Área=0,3413
A Probabilidade é
0,3413 + 0, 3413 = 0,6826
57
62
69
75
81
87
93
X
-3
-2
-1
0
1
2
3
Z
52
Questão 3: P(X < 62)
62  75  13
Z

 2,17
6
6
Area = 0,4850
A Probabilidade é
0,5000 - 0,4850 = 0,0150
53
Questão 4: P(62 ≤ X ≤ 69)
Z
62  75
 2,17
6
Area  0,4850
Z
69  75
 1,00
6
Area  0,3413
A Probabilidade é
0,4850 – 0,3413 = 0,1437
54
Questão 5
Quantos segundos devem transcorrer antes que 50%
dos trabalhadores da fábrica montem uma peça.
A Área é 0,5000
A Área é 0,5000
57
62
69
75
81
87
93
X
-3
-2
-1
0
1
2
3
Z
55
Questão 6
Quantos segundos devem transcorrer antes que 10%
dos trabalhadores da fábrica montem uma peça.
A Área é 0,4000
A Área é 0,5000
A Área é 0,1000
57
62
69
75
81
87
93
X
-3
-2
-1
0
1
2
3
Z
56
Questão 6
Quantos segundos devem transcorrer antes que 10%
dos trabalhadores da fábrica montem uma peça.
Z
A Área é 0,4000
X 

X  Z  
X  ( 1,28)  (6)  75
A Área é 0,1000
X  67,32seg
Z = 1,28
57
62
69
75
81
87
93
X
-3
-2
-1
0
1
2
3
Z
57
Caso: O problema da
Companhia Grear Tire
1) Suponha que Companhia Grear Tire acabou de desenvolver um
novo pneu radial cintado em aço e será vendido com desconto
através de uma cadeia nacional de lojas. Como o pneu é um novo
produto, os gerentes da Grear acreditam que a garantia de
quilometragem oferecida com o pneu será um fator importante na
aceitação do produto. Antes de concluírem a política de garantia
de quilometragem, os gerentes da Grear desejam informações de
probabilidade sobre o número de quilômetros em que os pneus se
gastarão.
A partir de testes reais com os pneus em auto-estrada, o grupo de
engenharia da Grear estimou a quilometragem média do pneu em
 = 36500 quilômetros e o desvio-padrão  = 5000. Além disso os
dados coletados indicam que a distribuição normal é uma hipótese
58
razoável.
Caso: O problema da
Companhia Grear Tire
Qual a porcentagem dos pneus que apresenta expectativa de
durar mais de 40000 quilômetros?
Vamos agora assumir que a Grear está considerando uma
garantia que fornecerá um desconto na substituição dos pneus se
os orginais não excederem a quilometragem declarada na
garantia. Qual deveria ser a quilometragem de garantia se a Grear
não quer mais do que 10% dos pneus qualificados elegíveis para a
garantia de desconto?
Entregar exercício, na próxima aula,
em grupos de até 3 alunos.
59
Exercícios de hoje
2)
O tempo médio que um assinante gasta lendo The Wall
Street Journal é de 49 minutos. Considere que o desviopadrão seja 16 minutos e que os tempos sejam
distribuídos normalmente.
a)
Qual é a probabilidade de que um assinante gastará
pelo menos 1 hora lendo o jornal?
b)
Qual é a probabilidade de que um assinante gastará não
mais do que 30 minutos lendo o jornal?
c)
Para os 10% que gastam o maior tempo lendo o jornal,
quanto tempo isso representa?
Entregar exercício, na próxima aula,
em grupos de até 3 alunos.
60
Exercícios de hoje
3) O volume de comercialização na Bolsa de Valores de Nova York tem
crescido nos últimos anos. Para as duas primeiras semanas de
janeiro de 1998, o volume médio diário foi cerca de 646 milhões de
ações. A distribuição de probabilidade do volume diário é
aproximadamente normal com um desvio-padrão de cerca de 100
milhões de ações.
a)
Qual é a probabilidade de que o volume de comercialização será
menor do que 400 milhões de ações?
b)
Durante que porcentagem de tempo o volume de comercialização
excedeu 800 milhões de ações?
c)
Se a Bolsa quer emitir um press release sobre os 5% de dias de
comercialização de pico,qual volume acionará o release?
Entregar exercício, na próxima aula,
em grupos de até 3 alunos.
61
Download

Apostila - Programa de PÓS