Risco e sua diversificação
1
Introdução
• Quando alguém empresta um capital, tem
como objectivo receber mais tarde esse
capital que emprestou acrescido dos juros
• Mas existe sempre uma probabilidade de
não receber nem uma coisa nem outra (no
todo ou em parte).
2
Introdução
• Na análise de um investimento, porque é
baseada em previsões quanto ao
desempenho futuro do negócio
– preços dos inputs, preços e quantidades dos
outputs, depreciação do capital, falhas e
descobertas tecnológicas
• A medida calculada a priori na avaliação
pode, a posteriori, vir a concretizar-se de
forma menos favorável.
3
Introdução
• No sentido de compreendermos o risco,
controlá-lo e utilizá-lo na tomada de
decisão, vamos neste capítulo apresentar
a modelização estatística do risco.
• Vamos necessitar de alguns conceitos
estatísticos.
4
Conceitos estatísticos básicos
5
Conceitos estatísticos básicos
• A Estatística descreve, organiza e
relaciona objectos e fenómenos
demasiado difíceis de apreender com as
ferramentas conceptuais da matemática
clássica (i.e., funções reais de variáveis
reais).
6
Conceitos estatísticos básicos
• A estatística reduz a dimensão do
fenómeno considerando
• poucas variáveis e
• Conhecimento difuso dessas variáveis
7
Conceitos estatísticos básicos
• Por exemplo, quando se constrói um
avião, é necessário colocar bancos
adequados para acomodar os deficientes /
obesos.
• Com é impossível saber as necessidades
nos voos futuros,
• Vamos
medir,
na
população,
a
percentagem de obesos,
• Vamos supor que 3% dos são obesos.
8
Conceitos estatísticos básicos
• Partindo
desta
informação
pouco
pormenorizada, eu posso calcular, com a
ajuda da estatística, qual as necessidades
das viagens futuras.
9
Conceitos estatísticos básicos
Percentagem de viagens
15%
10%
5%
0%
0
1
2
3
4
5
6
7
8
Número
9 10 11
12 de
13deficientes
14 15
Sabendo-se que 3% dos indivíduos são deficientes motores, em x% das
viagens futuras (com 200 passageiros) haverá necessidade de N lugares
10
Conceitos estatísticos básicos
• Num seguro de vida, o segurado paga um
prémio por ano e a seguradora constitui
reservas para fazer face à evolução da
idade .
• Se a seguradora souber a priori quantos
anos faltam para o segurado morrer,
calcula facilmente o prémio anual
(capitalizava os prémios pagos mais uma
margem).
11
Exercício
• Ex.2.1. Um indivíduo com 35 anos e que
vai morrer aos 85 anos pretende fazer um
seguro de vida em que a viúva recebe
1000€ quando ele morrer.
• Sendo que a seguradora aplica os
prémios recebidos a uma taxa de juro de
3% ao ano e pretende uma margem de
10%, determine quanto deverá ser o
prémio anual.
12
Exercício
• R. Estamos em presença de uma renda
antecipada que dura 50 anos a uma taxa
de 3% ao ano.
• Temos que determinar o prémio (i.e., a
prestação anual) que faz esta renda valer
1000€
13
Exercício




P
N
N
V  . 1  (1  i ) .(1  i ).(1  i )
i
V .i
P
N
N 1
1  (1  i )
.(1  i )
1000 0.03

50
51
1  1.03 1.03


 8.61€ / ano
14
Conceitos estatísticos básicos
• O prémio será as reservas mais 10%:
P = 8.61€/ano + 0.86€/ano = 9.50€/ano
15
Conceitos estatísticos básicos
• Mas, como o segurador não sabe a priori
com que idade o segurado vai morrer,
precisa de utilizar informação aproximada.
16
Noção de variável estatística
17
Noção de variável estatística
• Uma variável estatística tem que
• 1) ser passíveis de medição (ou de
classificação).
• 2) As variáveis seleccionadas têm que ser
informativas,
– não podem assumir valores iguais para todos
os indivíduos: e.g., não interessa dizer que a
pessoa tem duas pernas.
18
Noção de variável estatística
• 3) São simplificações do fenómeno em
estudo
– descrevem características parcelares.
19
Noção de variável estatística
• As variáveis podem ser
• Cardinais: são comparáveis em ordem (1.5m é
mais do que 1.0m) e em magnitude (1.5m é
mais 0.5m que 1.0m).
• Ordinais: são comparáveis em ordem (“bom
estado” é melhor do que “estado razoável”) mas
não em magnitude.
• Categóricas: não são possíveis de comparar
(azul não é comparável com vermelho).
20
Noção de variável estatística
• Também podem ser
• Quantitativas: traduzem quantidades;
– E.g., peso, altura e temperatura
• Qualitativas: traduzem qualidades.
– E.g., cor, textura e suavidade.
21
Noção de variável estatística
• Por questões de economia, apenas se
consideram as variáveis estritamente
necessárias
para
descrever
o
fenómeno/objecto em estudo com o
detalhe pretendido.
22
Exercício
• Ex.2.2. Uma instituição de crédito ao
consumo pretende descrever os clientes
(para distribuir pelos gestores de contas).
Identifique algumas variáveis que
considera relevantes na descrição dos
clientes (e fáceis de obter).
23
Exercício
• R. Nível de escolaridade, se está
empregado, o rendimento mensal, estado
civil, idade, se tem casa própria.
– Não interessará saber a altura, o tamanho
dos braços, etc. que seriam importantes para
um alfaiate.
24
Noção de população /
variável aleatória
25
Noção de população /
variável aleatória
• Identificadas as variáveis estatísticas
necessárias, a estatística irá responder
(parcialmente) ao problema de não
conhecermos a priori que valores vão
assumir essas variáveis num indivíduo
particular (ou no futuro).
26
Noção de população /
variável aleatória
• Por exemplo, para quem compra casa a
crédito, o seu esforço financeiro de um
determinado mês depende do rendimento
e da taxa de juro EURIBOR (que indexa a
prestação). No entanto, no dia da compra,
essas grandezas não são conhecidas,
e.g., no futuro 240º mês de vigência do
contrato de crédito.
27
Noção de população /
variável aleatória
• Em termos conceptuais vou preencher a
falta de informação relativamente a um
indivíduo particular assumindo que o meu
indivíduo vai ser uma escolha aleatória da
população a que pertence e da qual eu
conheço os “valores médios”.
28
Noção de população /
variável aleatória
• No exemplo dos aviões, não sei se um
cliente particular é deficiente motor ou não
mas sei que cada cliente pertence a uma
população em que 3% dos indivíduos são
deficientes motores.
29
Noção de população /
variável aleatória
• A variável aleatória será caracterizada por
• Um domínio de acontecimentos possíveis
• Uma medida em [0,1] associada a cada
sub-domínio
– traduz a probabilidade de se verificar um
acontecimento dentro desse sub-domínio
30
Noção de população /
variável aleatória
– A um sub-domínio vazio aplica 0
– A todo o domínio aplica 1
– A um sub-domínio não vazio aplica uma
grandeza no intervalo [0, 1]
31
Noção de população /
variável aleatória
• Consideremos que a variável é a altura.
• Posso imaginar que o domínio é uma
população de indivíduos (e.g., 10000)
• E que 13.72% dos indivíduos têm a altura
no intervalo [1.75m, 1.85m]
• À priori, a população não tem nenhum
indivíduo com determinada altura exacta
– e.g., 1.754229312705m.
32
Noção de população /
variável aleatória
• Em termos conceptuais, vou substituir a
variável sobre a qual existe uma falta de
informação por uma variável aleatória.
• O modelo do risco vai assumir que o
indivíduo desconhecido é retirado
aleatoriamente da população que a
variável aleatória condensa
33
Uso um modelo com as variáveis
conhecidas
34
E substituo a desconhecida por uma
variável aleatória
35
Uso da informação populacional.
• Ex.2.4. Um indivíduo com 35 anos pretende
fazer um seguro de vida em que a viúva recebe
1000€ quando ele morrer.
• A seguradora capitaliza as reservas à taxa de
3% ao ano;
• A probabilidade do indivíduo morrer com 65
anos é de 70% e de morrer com 85 anos é de
30%.
• Para um prémio anual for de 20€, determine o
lucro anual da seguradora.
36
Uso da informação populacional.
• As reservas são uma renda (antecipada)
que resolve
V .(1  i )
N


P
N
 . 1  (1  i ) .(1  i )
i
N
V .(1  i) .i
P
N
1  (1  i) .(1  i)


37
Uso da informação populacional.
• Então teremos que
• Se morrer aos 65 anos, a entrega deverá
ser 20.41€/ano pelo que o lucro será (um
prejuízo) 20 – 20.41 = – 0.41€/ano.
• Se morrer aos 85 anos, a entrega deverá
ser 8.61€/ano pelo que o lucro será
20 – 8.61 = 11.39€/ano ;
38
Uso da informação populacional.
• Para um indivíduo indeterminado, o lucro
será uma extracção aleatória com 70% de
probabilidade de ser – 0.41€/ano e 30%
de probabilidade de ser 11.39€/ano.
39
Uso da informação populacional.
• Ex.2.5. Estender o ex.2.4
probabilidades do quadro.
assumindo
as
40
Uso da informação populacional.
• R.
D6:=(B$1*$B$2)/(1-$D$2^-(B6$B$3))/$D$2^(B6-$B$3+1)
E6: =B$4-D6 e copiava em coluna:
41
Caracterização da
variável aleatória
42
Variáveis contínuas
• No ex. 2.5 caracterizamos a variável
aleatória atribuindo uma probabilidade a
cada um de 7 sub-domínio.
• Dentro de cada sub-domínio, assume-se
que todos os indivíduos têm o valor médio
do sub-domínio.
– E.g., em [40, 50] assume-se 45 para todos os
indivíduos desse sub-domínio
43
Variáveis contínuas
• A divisão em intervalos é uma técnica mas
pode não haver informação suficiente
• Poderemos utilizar uma função com
apenas dois parâmetros
– O valor médio
– A variabilidade em torno do valor médio
44
Variáveis contínuas
• Para cada ponto, a função de distribuição
• Pode ser F(x): probabilidade acumulada
de observar y<= x
• Pode ser f(x): densidade de probabilidade
de observar x
– limite da probabilidade por unidade de subdomínio quando este tende para o ponto
(com zero unidades).
45
Variáveis contínuas
• Em IR
• F ( A) 
A

f ( x)dx

• A probabilidade de se observar um
indivíduo no intervalo ]A, B] virá dada por
• F(B) – F(A)
B
•

f ( x)dx
A
46
Variáveis contínuas
• Ex.2.6. Supondo que a probabilidade de a
EURIBOR atingir determinado valor (de
um intervalo) é
• [0 a 2%]  5%;
]2% a 3%]  15%;
• ]3% a 4%]  30%;
]4% a 5%]  35%;
]5% a 8%]  12% e ]8% a 11%]  3%,
• determine as respectivas densidades de
probabilidade.
47
Variáveis contínuas
•
•
•
•
•
•
[0 a 2%]  2.5%/pp ;
]2% a 3%]  15%/pp ;
]3% a 4%]  30%/pp ;
]4% a 5%]  35%/pp ;
]5% a 8%]  4%/pp e
]8% a 11%]  1%/pp .
48
Variáveis contínuas
• Supondo
as
seguintes
densidades
de
probabilidade, determine a probabilidade de se
observar os limites dos sub-domínios
•
•
•
•
•
De
0
10
15
20
a
10
15
20
30
f(x)
0,010
0,025
0,065
0,025
• 30
50
0,010
49
Variáveis contínuas
•
•
•
•
•
D2: 0
E2: =(B2-A2)*C2+D2
G3: =(10-5)*C2
G4: =D5-D3
G6: =SUM(G2:G5)
D3: =E2
50
Variáveis contínuas
• Como, as probabilidades são previsões,
os pontos próximos serão praticamente
equivalentes.
• É aceitável utilizar a função de
distribuição.
51
Distribuição Normal
• É a distribuição mais importante porque é
“a distribuição limite” que resulta de
somarmos acontecimentos independentes
(depois veremos o que este conceito
representa).
52
Distribuição Normal
• É caracterizada por dois parâmetros, o
valor médio, , e o desvio padrão, , e
tem a forma de um sino
53
Distribuição Normal
Densidade de probabildiade0,4
0,3
0,2
0,1
0,0
-3
-2
-1
0
1
2
x3
54
Distribuição Normal
• São mais prováveis os valores próximos
da média.
• A probabilidade de o indivíduo extraído
cair dentro do intervalo
• ]  –;  + ] é de 68%
• ] – 2;  +2] é de 95%.
55
Estimação do valor médio
56
Estimação do valor médio
• Em termos económicos, o valor médio
quantifica a “componente sem risco” do
fenómeno que estamos a analisar.
57
Estimação do valor médio
• É a medida que contém mais informação
pelo que, se tivermos que atribuir apenas
um valor a um indivíduo particular
(desconhecido), será esta medida a que
deve ser utilizada (ou outra medida de
tendência central como, por exemplo, a
mediana).
58
Média aritmética simples
• Prova-se que, se os indivíduos forem
igualmente representativos, o melhor
estimador do valor médio é a média
aritmética dos indivíduos da amostra.
n
x1  x2  ...  xn
x

n
x
i 1
i
n
59
Exercício
• Ex.2.7. Um barco de investigação capturou em
Janeiro de 1990 na zona pesqueira da Terra Nova
10 bacalhaus cujo peso foram (em kg)
15.5, 17.9, 21.3, 13.1, 9.5, 7.9, 3.5, 19.1, 23.3, 7.2
Em Janeiro de 2008 foram pescados outros 10
bacalhaus (usando a mesma técnica) cujo peso
foram
10.4, 12.2, 11.1, 13.6, 9.2, 12.6, 6.1, 13.2, 12.3, 13.4
Que poderá dizer quanto à evolução da população
de bacalhau?
60
Exercício
• R. Estima-se que em Janeiro de 1990 o
peso médio unitário dos bacalhaus era
de 13.83kg e em Janeiro de 2008 era de
11.41kg.
• Assim, as estimativas apontam no
sentido da diminuição do peso médio
unitário da população de bacalhau.
61
Propriedades
A média do produto da constante a por
uma variável X é igual ao produto da
constante pela média aritmética da
variável (corresponde a uma mudança
de escala)
_____
___
ax  a x
62
Propriedades
A média da soma da constante a com a
variável X é igual à soma da constante
com a média da variável:
_____
___
ax a x
63
Propriedades
A média da soma da variável X com a
variável Y é igual à soma das médias
das variáveis:
_______
___
___
x y  x  y
64
Propriedades
• Supondo X ~ N (10, 5) e Y~N(7, 3).
• Quanto será o valor médio de
5X + 3
10 (3X+5Y)
12X(50.1Y)+3XY
65
Propriedades
5X + 3  5x10+3 = 53
10 (3X+5Y)  10x(3x10+5x7) = 650
12X(0.1Y)+3XY  Não sabemos mas
poderá andar próximo de
12x10(0.1x7)+3x10x7 = 270
O verdadeiro valor médio, truncando os valores negativos de X, é +- 308
66
Média aritmética ponderada
• Existem casos em que cada indivíduo da
amostra representa uma fatia diferente da
população.
• E.g., se na amostra recolhermos 100
pessoas do Porto e 100 de Lisboa, cada
pessoa de Lisboa representa mais
indivíduos.
67
Média aritmética ponderada
• Será necessário ponderar cada individuo
pela sua importância relativa. Sendo wi a
importância relativa do individuo i, teremos
w1 x1  w2 x2  ...  wn xn
x
w1  w2  ...  wn
68
Média aritmética ponderada
• Ex.2.9. Num inquérito, (dados fictícios) e
32% dos portugueses e 72% dos
espanhóis responderam que preferem o
Obama ao McCain.
• Obtenha uma estimativa (boa) para as
preferências dos ibéricos.
69
Média aritmética ponderada
• R. Como a Espanha tem 5 vezes mais
população, então um inquirido em
Espanha representa 5 vezes mais
pessoas que um inquirido em Portugal
pelo que as preferências médias são .
1  0.32  5  0.72
x
 65.3%
1 5
70
Média aritmética ponderada
• Média aritmética calculada com dados
agrupados em classes
• Quando recorremos a fontes, e.g. o INE, a
informação está agregada por intervalos.
• Pretende manter o anonimato dos
indivíduos.
71
Média aritmética ponderada
• No caso de os dados estarem agrupados
por classes, a “melhor” média é a média
aritmética ponderada em que é
considerado os valores de cada classe
como o ponto médio do intervalo e os
pesos são as frequências relativas de
cada classe.
72
Média aritmética ponderada
• Um indivíduo com 35 anos pretende fazer
um seguro de vida em que a viúva recebe
1000€ quando ele morrer.
• As probabilidade de morrer, em intervalos
de 10 anos, é dado e a taxa de desconto é
3%/ano.
• Qual o lucro médio anual da seguradora
se o prémio anual for de 50€,?
73
Média aritmética ponderada
74
Média geométrica simples
• É utilizada para calcular taxa médias, e.g.,
taxa de juro médias
• E.g. em 3 anos a EURIBOR foi (%/ano)
• 4.51; 4.67 e 5,21
• Então a taxa média anual foi
i  (1  4.51%)(1  4.67%)(1  5,21%)   1  4,80%
1
3
75
Média geométrica simples
• Sendo conhecidas as taxas de juros anualizadas
de cada mês, determine a taxa de juro média
anual.
N3: =PRODUTO(B3:M3)^(1/12)
N3: N3-1
76
Desvio padrão
77
Desvio padrão
• Em termos económicos, o desvio
padrão, , é uma medida do risco de
assumirmos o valor médio da
população como se fosse o valor
associado ao indivíduo.
78
Desvio padrão
• O desvio padrão, , é uma medida da
heterogeneidade da população (a
variabilidade em torno do valor
médio).
• Na Distribuição Normal, 68% dos
indivíduos estão em ]  –;  + ] e
95% em ] – 2;  +2].
79
Desvio padrão
• Sendo  o valor médio da população,
então o quadrado do desvio padrão, 2,
vem dado por (a variância):

x1     x2   
 
2
2
2
 ...  xn   
2
N
80
Propriedades do Desvio padrão
• Se os indivíduos forem todos iguais, o
desvio padrão é zero
 (a)  0
81
Propriedades do Desvio padrão
• O desvio padrão do produto da constante a
pela variável X é igual ao produto do
modulo da constante pelo desvio padrão
da variável:
 (a  x)  a  ( x)
82
Propriedades do Desvio padrão
• O desvio padrão da soma de uma
constante com uma variável X é igual ao
desvio padrão da variável X.
 ( a  x)   ( x)
83
Propriedades
• Supondo X ~ N (25, 5) e Y~N(15, 5).
• Quanto será o valor médio e o desvio
padrão de
5X + 3
-3Y - 15
12X2
84
Propriedades
• Supondo X ~ N (25, 5) e Y~N(15, 5).
5X + 3  N(126, 25)
-3Y - 15  N(-60, 15)
12X2  Não sabemos mas deverão estar
próximos de
Valor médio 12x252 = 7500
D.P. (12x(25+5)2 - 12x(25-5)2 )/2 = 3000
Os verdadeiros valores são 7800 e 3030
85
Estimação do Desvio padrão
• Quando temos uma amostra, estima-se o
desvio padrão como o desvio padrão
amostral mas descontado de um grau de
liberdade (perdido na estimação do valor
médio - conceito a desenvolver em
Estatística).
86
Estimação do Desvio padrão
• Em termos algébricos, dividimos a soma
dos desvios quadráticos dos indivíduos
relativamente à média amostral por (n – 1)
e achamos a sua raiz quadrada
x1  x   x2  x 
2
S
2
 ...  xn  x 
2
n 1
87
Exercício
• Voltando ao Ex.2.7 do bacalhau, construímos
uma folha de cálculo com os dados
D2: =(B2-B$12)^2 e copiava em linha e coluna
B13: =(Soma(D2:D11)/(Contar(B2:B11)-1))^0,5 e
copiava em linha.
– Podia também usar a função =DesvPad(B2:B11),
B16:
= 1-Dist.Norm($B$15;B12;B13;VERDADEIRO).
88
89
Estimação do Desvio padrão
• Desvio padrão ponderado e estimado com dados
agrupados
• Reutiliza-se a metodologia usada na estimação
do valor médio
w1  x1  x   ...  wn xn  x 
w1  ...  wn
2
S
2
90
Operações com variáveis
• Agora estamos em condições de realizar
operações de constantes com variáveis
aleatórias.
91
Exercício
• Ex.2.14. Compro os legumes a 0.50€/kg, pago
75€ pelo transporte e o preço de venda é
desconhecido mas tem distribuição normal com
média 0.60€/kg e desvio padrão de 0.15€/kg.
• i) Determine qual vai ser o meu lucro de
intermediar 1000kg de legumes.
• ii) Determine a probabilidade de eu ter prejuízo.
92
Exercício
i) Lucro = V.(Pvenda – Pcompra) – Ctransporte
= 1000[N(0.60, 0.15) – 0.50] – 75
Lucro = N(600, 0.15x1000) – 575 = N(25, 150)
ii) No Excel teríamos
A1: =Dist.Norm(0; 25; 150; Verdadeiro)  43.38%
93
Diversificação do risco
94
Diversificação do risco
• Neste ponto vou mostrar como um
modelo estatístico nos pode ajudar a
controlar o risco de uma actividade
económica.
• Em termos matemáticos, trata-se de
operações de soma de variáveis.
95
Diversificação do risco
• Em termos económicos trata-se de
construir uma carteira de activos
• “Não por os ovos todos no mesmo cesto”
• Uma concretização negativa de um activo
será estatisticamente compensada por
uma concretização positiva de outro activo
96
Associação entre variáveis
• Até este ponto, assumimos a existência
de apenas uma variável.
• No entanto, no geral usamos várias
variáveis na caracterização de um
indivíduo (no exemplo da pessoa usamos
a cor da pele, do cabelo, etc.).
97
Associação entre variáveis
• Algumas variáveis
independentes
estatísticas
são
– e.g., a cor do cabelo e o peso
• Outras, sem deixarem de ser aleatórias,
são dependentes
– e.g., a altura e o peso: os indivíduos mais
altos são, em média, os mais pesados.
98
Associação entre variáveis
• Em termos económicos (em que o
“individuo” é o período de tempo), existe
um certo grau de dependência entre os
investimentos
• e.g., se fizer calor vendem-se mais
gelados e menos camisolas.
99
Associação entre variáveis
• No sentido de poder realizar operações
algébricas com variáveis aleatórias (já o
fizemos com uma variável aleatória e
constantes),
vamos
modelizar
a
associação entre variáveis estatística
– A definição de independência de variáveis é
dada em Estatística I
100
Associação entre variáveis
• Variável discreta:
– Frequências relativas / probabilidades cruzadas
(de classes)
• A informação será semelhante à situação
em que apenas temos uma variável
estatística discreta (ou dividida em
classes), mas agora serão classes
conjuntas.
101
Associação entre variáveis
• E.g, cruzamos a cor da pele com a cor de
cabelo (duas variáveis qualitativas):
Pele \ Cabelo
Louro
Castanho
Escuro
Loura
5%
3%
1%
Morena
9%
45%
15%
Mulata
0%
2%
12%
Escura
0%
1%
7%
102
Associação entre variáveis
• E.g, dividimos duas variáveis contínuas
em classes:
Altura
peso
\
]0.0; 40.0]
]40.0; 80.0]
]80.0; 120.0]
Total
]0.5; 1.0]
10.6%
0.2%
0.0%
10.8%
]1.0; 1.5]
13.9%
40.0%
0.1%
54.0%
]1.5; 2.0]
0.3%
25.8%
9.1%
35.2%
Total
24.8%
66.0%
9.2%
100.0%
103
Associação entre variáveis
• Nas tabelas que cruzam duas variáveis, a soma
horizontal das frequências / probabilidades
quantifica a percentagem de indivíduos que
pertencem à correspondente classe das alturas
enquanto que a soma vertical quantifica a
percentagem de indivíduos que pertencem à
correspondente classe dos pesos.
104
Associação entre variáveis
• Variáveis contínuas : Covariância
• A covariância é uma medida que condensa
num só número a associação entre duas
variáveis estatísticas.
N
 ( x, y ) 
 x
i 1
i
  x  yi   y 
N
105
Associação entre variáveis
• Os indivíduos podem representar apenas
instantes de tempo diferentes, caso em
quem podemos trocar o índice i por t.
– E.g., a covariância entre a taxa EURIBOR
(desconhecidas) em dois dias consecutivos.
• A variância é um caso particular da
covariância:
2 =  (x, x)
106
Associação entre variáveis
• A covariância pode ser negativa, zero ou
positiva.
• É crescente com os desvios padrão das
variáveis
107
Associação entre variáveis
• Coeficiente de correlação linear de
Pearson, (x, y)
• Retira à covariância o efeito dos desvios
padrão
 ( x, y)
 ( x, y) 
 ( x)   ( y )
  ( x, y)   ( x, y)   ( x)   ( y)
108
Associação entre variáveis
• Coeficiente de correlação linear está no
intervalo [–1; 1]
• Se for zero, as variáveis não estão
associadas (linearmente).
• Se for –1 ou 1, estão perfeitamente
associados em sentido contrário ou no
mesmo sentido, respectivamente.
109
Associação entre variáveis
• O  tem ainda outro significado.
• O seu valor ao quadrado, conhecido por
R2, quantifica quanto eu posso reduzir na
variância de uma variável por conhecer a
concretização da outra variável.
110
Associação entre variáveis
• E.g, na população a variância do peso é
400, (o desvio padrão é 20 kg). Se eu
souber que o  entre a altura e o peso é
0.7, se eu conhecer a altura da pessoa,
reduzo a variância do peso para 51% (i.e.,
o desvio padrão diminui para 14.28kg).
111
Associação entre variáveis
• Propriedades da covariância e do
coeficiente de correlação linear
a) A covariância (e o coeficiente de
correlação linear) entre duas constantes
ou entre uma variável e uma constante é
zero
 (a, b) = 0; (a,X) = 0
112
Associação entre variáveis
b) Multiplicando uma das variáveis por uma
constante diferente de zero, a covariância
vem multiplicada e o coeficiente de
correlação linear mantém-se (a menos do
sinal):
 (a.X,Y) = a.(X,Y);
(a.X,Y) = sig(a). (X,Y)
113
Associação entre variáveis
c) Somando uma constante a uma das
variáveis, a covariância e o coeficiente de
correlação linear mantém-se:
 (a+X,Y) = (X,Y);
(a+X,Y) = (X,Y)
114
Associação entre variáveis
d) A covariância e o coeficiente
correlação são comutativos:
 (X,Y) = (Y,X);
(X,Y) = (Y,X)
de
115
Associação entre variáveis
Estimação da covariância e do coeficiente de
correlação linear.
Podemos usar uma amostra para estimar a
associação entre as variáveis
n
S ( X ,Y ) 
 x  x  y
i 1
i
i
 y
n 1
116
Exercício
Ex.2.15. Relativamente aos dados do quadro das
alturas e dos pesos, determine a covariância e
o coeficiente de correlação entre estas duas
variáveis. Que pode dizer acerca do grau de
associação?
117
Exercício
Primeiro, estimamos os valores médios
p  0.248 20  0.660 60  0.092 10  53.76
h  0.108 0.75  0.540 1.25  0.352 1.75  1.372
118
Exercício
Segundo, estimamos os desvios padrão

S ( p)  0.248 20  p   0.660 60  p   0.092 100 p 
2
2

2 0,5
 22.474
2
2
2

S (h)  0.108 0.75  h   0.540 1.25  h   0.352 1.75  h 

 0.316

119
0,5
Exercício
Terceiro, estimamos a covariancia
S (h, p)  0.106 0.75  h  20  p   0.139 1.25  h  20  p   ...
 4.641
120
Exercício
Finalmente, o coef. de cor. Linear
S (h, p)
4.641
r (h, p) 

 0.653
S ( p)  S (h) 22.47  0.316
Existe uma forte associação linear entre o peso e
a altura
121
Soma de variáveis estatísticas
diversificação do risco
122
Soma de variáveis estatísticas
• Até agora apenas somamos constantes com
variáveis
• É muito relevante no contexto da M.F. porque
modeliza o comportamento estatístico das
carteiras de activos partindo-se das
propriedades individuais dos activos que a
constituem.
123
Soma de variáveis estatísticas
• Distribuição da soma.
• Se as variáveis tiverem distribuição normal, então a
soma também terá distribuição normal.
• Se não tiverem, a soma será mais próxima da
distribuição normal que as distribuições das parcelas.
• A soma de + 30 variáveis aleatórias com distribuição
desconhecida que sejam pouco correlacionadas, pode
assumir-se que tem distribuição normal.
124
Soma de variáveis estatísticas
• Média da soma.
• Sendo que existem duas variáveis, X e Y,
• a soma Z = X + Y terá como valor médio a
soma dos valores médios de cada variável
estatística.
125
Soma de variáveis estatísticas
• Variância e desvio padrão da soma.
• Sendo que existem duas variáveis, X e Y,
• a soma Z = X + Y terá como variância a soma
das variâncias de cada variável mais duas
vezes a covariância.
 ( z)   ( x)  2 ( x, y)   ( y)
2
2
2
126
Exercício
• Ex.2.16. Um intermediário de legumes, quando
encomenda desconhece o preço de aquisição e de
venda dos legumes PC ~ N(0.50€/kg, 0.10€/kg).
• PV ~ N(0.60€/kg, 0.15€/kg).
• Tem que pagar 75€ pelo transporte.
• A correlação linear entre o preço de compra e de
venda é de 0.5
• i) Determine qual vai ser o lucro de intermediar
1000kg de legumes. ii) Determine a probabilidade de
ter prejuízo.
127
Exercício
• Trata-se de operações algébricas com variáveis
aleatórias.
• Lucro = 1000(PV – PC) –75.
PV – PC = N(0.60, 0.15) – N(0.50, 0.10)
= N(0.60, 0.15) + N(– 0.50, 0.10)
= N(0.10, (0.152+2(-0.5)0.150.10+0.102))
= N(0.10, 0.132)
Troca o sinal da correlação porque está a subtrair
128
Exercício
• Trata-se de operações algébricas com variáveis
aleatórias.
1000 N(0.10, 0.132) = N(100, 132)
N(100, 132) –75 = N(25, 132)
No Excel, =NORMDIST(0; 25; 132;TRUE)
Tenho 42.5% de probabilidade de ter prejuízo
129
Exercício
• Ex.2.18. Vamos supor que o rendimento de uma
família segue distribuição R = N(1250, 250) com
tendência de aumentar 0.1% ao mês
• Que a prestação da casa é
P = V.(EURIBOR + 0.5/prazo)/12 em que a
EURIBOR segue distribuição N(0.03, 0.01).
• O coeficiente de correlação linear entre a
EURIBOR e o rendimento é –0.2.
130
Exercício
• O cálculo da prestação não é feito de
forma correcta
• Seria uma renda antecipada de duração
limitada
• Mas serve para ilustrar o uso das somas
de variáveis aleatórias.
131
Exercício
• i) Determine a evolução do rendimento
disponível.
• ii) Para um prazo de 50 anos, qual será o
montante que implica que a probabilidade
média de nos primeiros 60 meses do
contrato o rendimento disponível ser maior
que 750€ é 90%?
132
Exercício
• i) Como RD = R – P =
• N(1250, 250)x1.001t –
V.[N(0.03, 0.01) + 0.5/prazo]/12
• Resulta uma distribuição normal com
• Média = 1250 x1.001t– V.(0.03+0.5/prazo)/12
• Desvio padrão = [(250x1.001t)2 +
+ 2x0.2x250 x1.001t xVx0.01/12 +
+ (Vx 0.01/12)2]0,5
Troca o sinal da correlação porque está a subtrair
133
Exercício
• ii) Implementei o modelo em Excel
• Vou alterar o valor do empréstimo (F1) até a
média da probabilidade dar 10%
MRD = Média do rendimento disponível
DPRD = Desvio Padrão do rendimento disponível
134
Exercício
135
Exercício
• B2: =1250*1,001^A2-$F$1*0,04/12
• C2: =((250*1,001^A2)^2+2*0,2*250*1,001^A2
*$F$1*0,01/12+($F$1*0,01/12)^2)^0,5
• D2: =DIST.NORM(750;B2;C2;VERDADEIRO)
• F2: =MÉDIA(D2:D61)
• E depois copio em coluna. Finalmente, uso a
ferramenta “atingir objectivo”, definir a célula
F1 para o valor 0,1 por alteração da célula
F2.
136
Exercício
• Potenciais clientes com idade A = N(40, 10)
anos pretendem fazer um seguro de vida em
que alguém recebe 1000€ quando ele morrer
que será com a idade M = N(75, 15) e que M
é independente de A.
– Numa seguradora “verdadeira”, o prémio é
crescente com a idade de constituição do seguro.
– A independência é para simplificar os cálculos
137
Exercício
• Supondo que a seguradora capitaliza os
prémios à taxa 3% ao ano e que prevê
arranjar 1000 clientes não correlacionados
entre si, determine, o prémio anual
antecipado e igual para todos
de forma que o lucro médio menos o desvio
padrão do lucro seja positivo (traduz uma
probabilidade de 85% do lucro ser positivo).
138
Exercício
A duração do individuo será D = M – A =
= N(75 – 40, (102+152)) = N(35, 18.03).
A prestação será (de uma renda antecipada
capitalizada para o futuro)


P
N
N
V  . 1  (1  i ) .(1  i ).(1  i )
i
P
V .i
1  (1  i)  .(1  i)
N
N 1
139
Exercício
o lucro anual = Prémio – P que é uma variável
aleatória de distribuição com forma funcional
desconhecida mas com média Mi e desvio
padrão DPi.
Como vou somar o lucro de 1000 indivíduos
não correlacionados, resulta uma distribuição
normal N(1000Mi, 10000.5DPi).
Vou agora usar o Excel
140
Exercício
Nota2(8Nov): Surgiram dúvidas no cálculo do lucro da
seguradora porque este apenas se concretiza
quando o cliente morrer (ou desiste do seguro). No
entanto, estou a considerar, sem perda de
generalidade, que, em termos contabilísticos, a
seguradora constitui reservas exactamente do valor
da prestação necessária para capitalizar os 1000€ e
considera o restante como lucro do exercício que
distribui como dividendos. Também não estava claro
no próximo exercício que cada “idade de morte”
traduz o ponto médio de um intervalo de dez anos.
141
Exercício
142
Exercício
• Calculava a dens. de probabilidade da
duração,
B2: =DIST.NORM(A2; 35;18,03;FALSO)
• O Lucro em função da duração do cliente,
=$F$2-(1000*0,03)/(1-1,03^-A2)/1,03^(A2+1)
Na coluna B deveríamos ter probabilidades e
temos densidades de probabilidade o que é
equivalente quando os espaçamentos entre
valores são unitários (ou idênticos).
143
Exercício
• Calculava a média e o d.p. ponderados do
lucro,
D2: =C2*B2; E2: =B2*(D2-$D$73)^2 copiava
em coluna;
D73: =SOMA(D2:D71)/$B$73 e copiava em
linha.
144
Exercício
•
•
•
•
Calculava para os 1000 indivíduos,
D74: =1000*D73;
E74: =1000^0,5*E73;
F74: =D74-E74
• Utilizava a ferramenta “atingir objectivo”,
definir a célula F74 para o valor 0 por
alteração da célula F2.
145