Risco e sua diversificação 1 Introdução • Quando alguém empresta um capital, tem como objectivo receber mais tarde esse capital que emprestou acrescido dos juros • Mas existe sempre uma probabilidade de não receber nem uma coisa nem outra (no todo ou em parte). 2 Introdução • Na análise de um investimento, porque é baseada em previsões quanto ao desempenho futuro do negócio – preços dos inputs, preços e quantidades dos outputs, depreciação do capital, falhas e descobertas tecnológicas • A medida calculada a priori na avaliação pode, a posteriori, vir a concretizar-se de forma menos favorável. 3 Introdução • No sentido de compreendermos o risco, controlá-lo e utilizá-lo na tomada de decisão, vamos neste capítulo apresentar a modelização estatística do risco. • Vamos necessitar de alguns conceitos estatísticos. 4 Conceitos estatísticos básicos 5 Conceitos estatísticos básicos • A Estatística descreve, organiza e relaciona objectos e fenómenos demasiado difíceis de apreender com as ferramentas conceptuais da matemática clássica (i.e., funções reais de variáveis reais). 6 Conceitos estatísticos básicos • A estatística reduz a dimensão do fenómeno considerando • poucas variáveis e • Conhecimento difuso dessas variáveis 7 Conceitos estatísticos básicos • Por exemplo, quando se constrói um avião, é necessário colocar bancos adequados para acomodar os deficientes / obesos. • Com é impossível saber as necessidades nos voos futuros, • Vamos medir, na população, a percentagem de obesos, • Vamos supor que 3% dos são obesos. 8 Conceitos estatísticos básicos • Partindo desta informação pouco pormenorizada, eu posso calcular, com a ajuda da estatística, qual as necessidades das viagens futuras. 9 Conceitos estatísticos básicos Percentagem de viagens 15% 10% 5% 0% 0 1 2 3 4 5 6 7 8 Número 9 10 11 12 de 13deficientes 14 15 Sabendo-se que 3% dos indivíduos são deficientes motores, em x% das viagens futuras (com 200 passageiros) haverá necessidade de N lugares 10 Conceitos estatísticos básicos • Num seguro de vida, o segurado paga um prémio por ano e a seguradora constitui reservas para fazer face à evolução da idade . • Se a seguradora souber a priori quantos anos faltam para o segurado morrer, calcula facilmente o prémio anual (capitalizava os prémios pagos mais uma margem). 11 Exercício • Ex.2.1. Um indivíduo com 35 anos e que vai morrer aos 85 anos pretende fazer um seguro de vida em que a viúva recebe 1000€ quando ele morrer. • Sendo que a seguradora aplica os prémios recebidos a uma taxa de juro de 3% ao ano e pretende uma margem de 10%, determine quanto deverá ser o prémio anual. 12 Exercício • R. Estamos em presença de uma renda antecipada que dura 50 anos a uma taxa de 3% ao ano. • Temos que determinar o prémio (i.e., a prestação anual) que faz esta renda valer 1000€ 13 Exercício P N N V . 1 (1 i ) .(1 i ).(1 i ) i V .i P N N 1 1 (1 i ) .(1 i ) 1000 0.03 50 51 1 1.03 1.03 8.61€ / ano 14 Conceitos estatísticos básicos • O prémio será as reservas mais 10%: P = 8.61€/ano + 0.86€/ano = 9.50€/ano 15 Conceitos estatísticos básicos • Mas, como o segurador não sabe a priori com que idade o segurado vai morrer, precisa de utilizar informação aproximada. 16 Noção de variável estatística 17 Noção de variável estatística • Uma variável estatística tem que • 1) ser passíveis de medição (ou de classificação). • 2) As variáveis seleccionadas têm que ser informativas, – não podem assumir valores iguais para todos os indivíduos: e.g., não interessa dizer que a pessoa tem duas pernas. 18 Noção de variável estatística • 3) São simplificações do fenómeno em estudo – descrevem características parcelares. 19 Noção de variável estatística • As variáveis podem ser • Cardinais: são comparáveis em ordem (1.5m é mais do que 1.0m) e em magnitude (1.5m é mais 0.5m que 1.0m). • Ordinais: são comparáveis em ordem (“bom estado” é melhor do que “estado razoável”) mas não em magnitude. • Categóricas: não são possíveis de comparar (azul não é comparável com vermelho). 20 Noção de variável estatística • Também podem ser • Quantitativas: traduzem quantidades; – E.g., peso, altura e temperatura • Qualitativas: traduzem qualidades. – E.g., cor, textura e suavidade. 21 Noção de variável estatística • Por questões de economia, apenas se consideram as variáveis estritamente necessárias para descrever o fenómeno/objecto em estudo com o detalhe pretendido. 22 Exercício • Ex.2.2. Uma instituição de crédito ao consumo pretende descrever os clientes (para distribuir pelos gestores de contas). Identifique algumas variáveis que considera relevantes na descrição dos clientes (e fáceis de obter). 23 Exercício • R. Nível de escolaridade, se está empregado, o rendimento mensal, estado civil, idade, se tem casa própria. – Não interessará saber a altura, o tamanho dos braços, etc. que seriam importantes para um alfaiate. 24 Noção de população / variável aleatória 25 Noção de população / variável aleatória • Identificadas as variáveis estatísticas necessárias, a estatística irá responder (parcialmente) ao problema de não conhecermos a priori que valores vão assumir essas variáveis num indivíduo particular (ou no futuro). 26 Noção de população / variável aleatória • Por exemplo, para quem compra casa a crédito, o seu esforço financeiro de um determinado mês depende do rendimento e da taxa de juro EURIBOR (que indexa a prestação). No entanto, no dia da compra, essas grandezas não são conhecidas, e.g., no futuro 240º mês de vigência do contrato de crédito. 27 Noção de população / variável aleatória • Em termos conceptuais vou preencher a falta de informação relativamente a um indivíduo particular assumindo que o meu indivíduo vai ser uma escolha aleatória da população a que pertence e da qual eu conheço os “valores médios”. 28 Noção de população / variável aleatória • No exemplo dos aviões, não sei se um cliente particular é deficiente motor ou não mas sei que cada cliente pertence a uma população em que 3% dos indivíduos são deficientes motores. 29 Noção de população / variável aleatória • A variável aleatória será caracterizada por • Um domínio de acontecimentos possíveis • Uma medida em [0,1] associada a cada sub-domínio – traduz a probabilidade de se verificar um acontecimento dentro desse sub-domínio 30 Noção de população / variável aleatória – A um sub-domínio vazio aplica 0 – A todo o domínio aplica 1 – A um sub-domínio não vazio aplica uma grandeza no intervalo [0, 1] 31 Noção de população / variável aleatória • Consideremos que a variável é a altura. • Posso imaginar que o domínio é uma população de indivíduos (e.g., 10000) • E que 13.72% dos indivíduos têm a altura no intervalo [1.75m, 1.85m] • À priori, a população não tem nenhum indivíduo com determinada altura exacta – e.g., 1.754229312705m. 32 Noção de população / variável aleatória • Em termos conceptuais, vou substituir a variável sobre a qual existe uma falta de informação por uma variável aleatória. • O modelo do risco vai assumir que o indivíduo desconhecido é retirado aleatoriamente da população que a variável aleatória condensa 33 Uso um modelo com as variáveis conhecidas 34 E substituo a desconhecida por uma variável aleatória 35 Uso da informação populacional. • Ex.2.4. Um indivíduo com 35 anos pretende fazer um seguro de vida em que a viúva recebe 1000€ quando ele morrer. • A seguradora capitaliza as reservas à taxa de 3% ao ano; • A probabilidade do indivíduo morrer com 65 anos é de 70% e de morrer com 85 anos é de 30%. • Para um prémio anual for de 20€, determine o lucro anual da seguradora. 36 Uso da informação populacional. • As reservas são uma renda (antecipada) que resolve V .(1 i ) N P N . 1 (1 i ) .(1 i ) i N V .(1 i) .i P N 1 (1 i) .(1 i) 37 Uso da informação populacional. • Então teremos que • Se morrer aos 65 anos, a entrega deverá ser 20.41€/ano pelo que o lucro será (um prejuízo) 20 – 20.41 = – 0.41€/ano. • Se morrer aos 85 anos, a entrega deverá ser 8.61€/ano pelo que o lucro será 20 – 8.61 = 11.39€/ano ; 38 Uso da informação populacional. • Para um indivíduo indeterminado, o lucro será uma extracção aleatória com 70% de probabilidade de ser – 0.41€/ano e 30% de probabilidade de ser 11.39€/ano. 39 Uso da informação populacional. • Ex.2.5. Estender o ex.2.4 probabilidades do quadro. assumindo as 40 Uso da informação populacional. • R. D6:=(B$1*$B$2)/(1-$D$2^-(B6$B$3))/$D$2^(B6-$B$3+1) E6: =B$4-D6 e copiava em coluna: 41 Caracterização da variável aleatória 42 Variáveis contínuas • No ex. 2.5 caracterizamos a variável aleatória atribuindo uma probabilidade a cada um de 7 sub-domínio. • Dentro de cada sub-domínio, assume-se que todos os indivíduos têm o valor médio do sub-domínio. – E.g., em [40, 50] assume-se 45 para todos os indivíduos desse sub-domínio 43 Variáveis contínuas • A divisão em intervalos é uma técnica mas pode não haver informação suficiente • Poderemos utilizar uma função com apenas dois parâmetros – O valor médio – A variabilidade em torno do valor médio 44 Variáveis contínuas • Para cada ponto, a função de distribuição • Pode ser F(x): probabilidade acumulada de observar y<= x • Pode ser f(x): densidade de probabilidade de observar x – limite da probabilidade por unidade de subdomínio quando este tende para o ponto (com zero unidades). 45 Variáveis contínuas • Em IR • F ( A) A f ( x)dx • A probabilidade de se observar um indivíduo no intervalo ]A, B] virá dada por • F(B) – F(A) B • f ( x)dx A 46 Variáveis contínuas • Ex.2.6. Supondo que a probabilidade de a EURIBOR atingir determinado valor (de um intervalo) é • [0 a 2%] 5%; ]2% a 3%] 15%; • ]3% a 4%] 30%; ]4% a 5%] 35%; ]5% a 8%] 12% e ]8% a 11%] 3%, • determine as respectivas densidades de probabilidade. 47 Variáveis contínuas • • • • • • [0 a 2%] 2.5%/pp ; ]2% a 3%] 15%/pp ; ]3% a 4%] 30%/pp ; ]4% a 5%] 35%/pp ; ]5% a 8%] 4%/pp e ]8% a 11%] 1%/pp . 48 Variáveis contínuas • Supondo as seguintes densidades de probabilidade, determine a probabilidade de se observar os limites dos sub-domínios • • • • • De 0 10 15 20 a 10 15 20 30 f(x) 0,010 0,025 0,065 0,025 • 30 50 0,010 49 Variáveis contínuas • • • • • D2: 0 E2: =(B2-A2)*C2+D2 G3: =(10-5)*C2 G4: =D5-D3 G6: =SUM(G2:G5) D3: =E2 50 Variáveis contínuas • Como, as probabilidades são previsões, os pontos próximos serão praticamente equivalentes. • É aceitável utilizar a função de distribuição. 51 Distribuição Normal • É a distribuição mais importante porque é “a distribuição limite” que resulta de somarmos acontecimentos independentes (depois veremos o que este conceito representa). 52 Distribuição Normal • É caracterizada por dois parâmetros, o valor médio, , e o desvio padrão, , e tem a forma de um sino 53 Distribuição Normal Densidade de probabildiade0,4 0,3 0,2 0,1 0,0 -3 -2 -1 0 1 2 x3 54 Distribuição Normal • São mais prováveis os valores próximos da média. • A probabilidade de o indivíduo extraído cair dentro do intervalo • ] –; + ] é de 68% • ] – 2; +2] é de 95%. 55 Estimação do valor médio 56 Estimação do valor médio • Em termos económicos, o valor médio quantifica a “componente sem risco” do fenómeno que estamos a analisar. 57 Estimação do valor médio • É a medida que contém mais informação pelo que, se tivermos que atribuir apenas um valor a um indivíduo particular (desconhecido), será esta medida a que deve ser utilizada (ou outra medida de tendência central como, por exemplo, a mediana). 58 Média aritmética simples • Prova-se que, se os indivíduos forem igualmente representativos, o melhor estimador do valor médio é a média aritmética dos indivíduos da amostra. n x1 x2 ... xn x n x i 1 i n 59 Exercício • Ex.2.7. Um barco de investigação capturou em Janeiro de 1990 na zona pesqueira da Terra Nova 10 bacalhaus cujo peso foram (em kg) 15.5, 17.9, 21.3, 13.1, 9.5, 7.9, 3.5, 19.1, 23.3, 7.2 Em Janeiro de 2008 foram pescados outros 10 bacalhaus (usando a mesma técnica) cujo peso foram 10.4, 12.2, 11.1, 13.6, 9.2, 12.6, 6.1, 13.2, 12.3, 13.4 Que poderá dizer quanto à evolução da população de bacalhau? 60 Exercício • R. Estima-se que em Janeiro de 1990 o peso médio unitário dos bacalhaus era de 13.83kg e em Janeiro de 2008 era de 11.41kg. • Assim, as estimativas apontam no sentido da diminuição do peso médio unitário da população de bacalhau. 61 Propriedades A média do produto da constante a por uma variável X é igual ao produto da constante pela média aritmética da variável (corresponde a uma mudança de escala) _____ ___ ax a x 62 Propriedades A média da soma da constante a com a variável X é igual à soma da constante com a média da variável: _____ ___ ax a x 63 Propriedades A média da soma da variável X com a variável Y é igual à soma das médias das variáveis: _______ ___ ___ x y x y 64 Propriedades • Supondo X ~ N (10, 5) e Y~N(7, 3). • Quanto será o valor médio de 5X + 3 10 (3X+5Y) 12X(50.1Y)+3XY 65 Propriedades 5X + 3 5x10+3 = 53 10 (3X+5Y) 10x(3x10+5x7) = 650 12X(0.1Y)+3XY Não sabemos mas poderá andar próximo de 12x10(0.1x7)+3x10x7 = 270 O verdadeiro valor médio, truncando os valores negativos de X, é +- 308 66 Média aritmética ponderada • Existem casos em que cada indivíduo da amostra representa uma fatia diferente da população. • E.g., se na amostra recolhermos 100 pessoas do Porto e 100 de Lisboa, cada pessoa de Lisboa representa mais indivíduos. 67 Média aritmética ponderada • Será necessário ponderar cada individuo pela sua importância relativa. Sendo wi a importância relativa do individuo i, teremos w1 x1 w2 x2 ... wn xn x w1 w2 ... wn 68 Média aritmética ponderada • Ex.2.9. Num inquérito, (dados fictícios) e 32% dos portugueses e 72% dos espanhóis responderam que preferem o Obama ao McCain. • Obtenha uma estimativa (boa) para as preferências dos ibéricos. 69 Média aritmética ponderada • R. Como a Espanha tem 5 vezes mais população, então um inquirido em Espanha representa 5 vezes mais pessoas que um inquirido em Portugal pelo que as preferências médias são . 1 0.32 5 0.72 x 65.3% 1 5 70 Média aritmética ponderada • Média aritmética calculada com dados agrupados em classes • Quando recorremos a fontes, e.g. o INE, a informação está agregada por intervalos. • Pretende manter o anonimato dos indivíduos. 71 Média aritmética ponderada • No caso de os dados estarem agrupados por classes, a “melhor” média é a média aritmética ponderada em que é considerado os valores de cada classe como o ponto médio do intervalo e os pesos são as frequências relativas de cada classe. 72 Média aritmética ponderada • Um indivíduo com 35 anos pretende fazer um seguro de vida em que a viúva recebe 1000€ quando ele morrer. • As probabilidade de morrer, em intervalos de 10 anos, é dado e a taxa de desconto é 3%/ano. • Qual o lucro médio anual da seguradora se o prémio anual for de 50€,? 73 Média aritmética ponderada 74 Média geométrica simples • É utilizada para calcular taxa médias, e.g., taxa de juro médias • E.g. em 3 anos a EURIBOR foi (%/ano) • 4.51; 4.67 e 5,21 • Então a taxa média anual foi i (1 4.51%)(1 4.67%)(1 5,21%) 1 4,80% 1 3 75 Média geométrica simples • Sendo conhecidas as taxas de juros anualizadas de cada mês, determine a taxa de juro média anual. N3: =PRODUTO(B3:M3)^(1/12) N3: N3-1 76 Desvio padrão 77 Desvio padrão • Em termos económicos, o desvio padrão, , é uma medida do risco de assumirmos o valor médio da população como se fosse o valor associado ao indivíduo. 78 Desvio padrão • O desvio padrão, , é uma medida da heterogeneidade da população (a variabilidade em torno do valor médio). • Na Distribuição Normal, 68% dos indivíduos estão em ] –; + ] e 95% em ] – 2; +2]. 79 Desvio padrão • Sendo o valor médio da população, então o quadrado do desvio padrão, 2, vem dado por (a variância): x1 x2 2 2 2 ... xn 2 N 80 Propriedades do Desvio padrão • Se os indivíduos forem todos iguais, o desvio padrão é zero (a) 0 81 Propriedades do Desvio padrão • O desvio padrão do produto da constante a pela variável X é igual ao produto do modulo da constante pelo desvio padrão da variável: (a x) a ( x) 82 Propriedades do Desvio padrão • O desvio padrão da soma de uma constante com uma variável X é igual ao desvio padrão da variável X. ( a x) ( x) 83 Propriedades • Supondo X ~ N (25, 5) e Y~N(15, 5). • Quanto será o valor médio e o desvio padrão de 5X + 3 -3Y - 15 12X2 84 Propriedades • Supondo X ~ N (25, 5) e Y~N(15, 5). 5X + 3 N(126, 25) -3Y - 15 N(-60, 15) 12X2 Não sabemos mas deverão estar próximos de Valor médio 12x252 = 7500 D.P. (12x(25+5)2 - 12x(25-5)2 )/2 = 3000 Os verdadeiros valores são 7800 e 3030 85 Estimação do Desvio padrão • Quando temos uma amostra, estima-se o desvio padrão como o desvio padrão amostral mas descontado de um grau de liberdade (perdido na estimação do valor médio - conceito a desenvolver em Estatística). 86 Estimação do Desvio padrão • Em termos algébricos, dividimos a soma dos desvios quadráticos dos indivíduos relativamente à média amostral por (n – 1) e achamos a sua raiz quadrada x1 x x2 x 2 S 2 ... xn x 2 n 1 87 Exercício • Voltando ao Ex.2.7 do bacalhau, construímos uma folha de cálculo com os dados D2: =(B2-B$12)^2 e copiava em linha e coluna B13: =(Soma(D2:D11)/(Contar(B2:B11)-1))^0,5 e copiava em linha. – Podia também usar a função =DesvPad(B2:B11), B16: = 1-Dist.Norm($B$15;B12;B13;VERDADEIRO). 88 89 Estimação do Desvio padrão • Desvio padrão ponderado e estimado com dados agrupados • Reutiliza-se a metodologia usada na estimação do valor médio w1 x1 x ... wn xn x w1 ... wn 2 S 2 90 Operações com variáveis • Agora estamos em condições de realizar operações de constantes com variáveis aleatórias. 91 Exercício • Ex.2.14. Compro os legumes a 0.50€/kg, pago 75€ pelo transporte e o preço de venda é desconhecido mas tem distribuição normal com média 0.60€/kg e desvio padrão de 0.15€/kg. • i) Determine qual vai ser o meu lucro de intermediar 1000kg de legumes. • ii) Determine a probabilidade de eu ter prejuízo. 92 Exercício i) Lucro = V.(Pvenda – Pcompra) – Ctransporte = 1000[N(0.60, 0.15) – 0.50] – 75 Lucro = N(600, 0.15x1000) – 575 = N(25, 150) ii) No Excel teríamos A1: =Dist.Norm(0; 25; 150; Verdadeiro) 43.38% 93 Diversificação do risco 94 Diversificação do risco • Neste ponto vou mostrar como um modelo estatístico nos pode ajudar a controlar o risco de uma actividade económica. • Em termos matemáticos, trata-se de operações de soma de variáveis. 95 Diversificação do risco • Em termos económicos trata-se de construir uma carteira de activos • “Não por os ovos todos no mesmo cesto” • Uma concretização negativa de um activo será estatisticamente compensada por uma concretização positiva de outro activo 96 Associação entre variáveis • Até este ponto, assumimos a existência de apenas uma variável. • No entanto, no geral usamos várias variáveis na caracterização de um indivíduo (no exemplo da pessoa usamos a cor da pele, do cabelo, etc.). 97 Associação entre variáveis • Algumas variáveis independentes estatísticas são – e.g., a cor do cabelo e o peso • Outras, sem deixarem de ser aleatórias, são dependentes – e.g., a altura e o peso: os indivíduos mais altos são, em média, os mais pesados. 98 Associação entre variáveis • Em termos económicos (em que o “individuo” é o período de tempo), existe um certo grau de dependência entre os investimentos • e.g., se fizer calor vendem-se mais gelados e menos camisolas. 99 Associação entre variáveis • No sentido de poder realizar operações algébricas com variáveis aleatórias (já o fizemos com uma variável aleatória e constantes), vamos modelizar a associação entre variáveis estatística – A definição de independência de variáveis é dada em Estatística I 100 Associação entre variáveis • Variável discreta: – Frequências relativas / probabilidades cruzadas (de classes) • A informação será semelhante à situação em que apenas temos uma variável estatística discreta (ou dividida em classes), mas agora serão classes conjuntas. 101 Associação entre variáveis • E.g, cruzamos a cor da pele com a cor de cabelo (duas variáveis qualitativas): Pele \ Cabelo Louro Castanho Escuro Loura 5% 3% 1% Morena 9% 45% 15% Mulata 0% 2% 12% Escura 0% 1% 7% 102 Associação entre variáveis • E.g, dividimos duas variáveis contínuas em classes: Altura peso \ ]0.0; 40.0] ]40.0; 80.0] ]80.0; 120.0] Total ]0.5; 1.0] 10.6% 0.2% 0.0% 10.8% ]1.0; 1.5] 13.9% 40.0% 0.1% 54.0% ]1.5; 2.0] 0.3% 25.8% 9.1% 35.2% Total 24.8% 66.0% 9.2% 100.0% 103 Associação entre variáveis • Nas tabelas que cruzam duas variáveis, a soma horizontal das frequências / probabilidades quantifica a percentagem de indivíduos que pertencem à correspondente classe das alturas enquanto que a soma vertical quantifica a percentagem de indivíduos que pertencem à correspondente classe dos pesos. 104 Associação entre variáveis • Variáveis contínuas : Covariância • A covariância é uma medida que condensa num só número a associação entre duas variáveis estatísticas. N ( x, y ) x i 1 i x yi y N 105 Associação entre variáveis • Os indivíduos podem representar apenas instantes de tempo diferentes, caso em quem podemos trocar o índice i por t. – E.g., a covariância entre a taxa EURIBOR (desconhecidas) em dois dias consecutivos. • A variância é um caso particular da covariância: 2 = (x, x) 106 Associação entre variáveis • A covariância pode ser negativa, zero ou positiva. • É crescente com os desvios padrão das variáveis 107 Associação entre variáveis • Coeficiente de correlação linear de Pearson, (x, y) • Retira à covariância o efeito dos desvios padrão ( x, y) ( x, y) ( x) ( y ) ( x, y) ( x, y) ( x) ( y) 108 Associação entre variáveis • Coeficiente de correlação linear está no intervalo [–1; 1] • Se for zero, as variáveis não estão associadas (linearmente). • Se for –1 ou 1, estão perfeitamente associados em sentido contrário ou no mesmo sentido, respectivamente. 109 Associação entre variáveis • O tem ainda outro significado. • O seu valor ao quadrado, conhecido por R2, quantifica quanto eu posso reduzir na variância de uma variável por conhecer a concretização da outra variável. 110 Associação entre variáveis • E.g, na população a variância do peso é 400, (o desvio padrão é 20 kg). Se eu souber que o entre a altura e o peso é 0.7, se eu conhecer a altura da pessoa, reduzo a variância do peso para 51% (i.e., o desvio padrão diminui para 14.28kg). 111 Associação entre variáveis • Propriedades da covariância e do coeficiente de correlação linear a) A covariância (e o coeficiente de correlação linear) entre duas constantes ou entre uma variável e uma constante é zero (a, b) = 0; (a,X) = 0 112 Associação entre variáveis b) Multiplicando uma das variáveis por uma constante diferente de zero, a covariância vem multiplicada e o coeficiente de correlação linear mantém-se (a menos do sinal): (a.X,Y) = a.(X,Y); (a.X,Y) = sig(a). (X,Y) 113 Associação entre variáveis c) Somando uma constante a uma das variáveis, a covariância e o coeficiente de correlação linear mantém-se: (a+X,Y) = (X,Y); (a+X,Y) = (X,Y) 114 Associação entre variáveis d) A covariância e o coeficiente correlação são comutativos: (X,Y) = (Y,X); (X,Y) = (Y,X) de 115 Associação entre variáveis Estimação da covariância e do coeficiente de correlação linear. Podemos usar uma amostra para estimar a associação entre as variáveis n S ( X ,Y ) x x y i 1 i i y n 1 116 Exercício Ex.2.15. Relativamente aos dados do quadro das alturas e dos pesos, determine a covariância e o coeficiente de correlação entre estas duas variáveis. Que pode dizer acerca do grau de associação? 117 Exercício Primeiro, estimamos os valores médios p 0.248 20 0.660 60 0.092 10 53.76 h 0.108 0.75 0.540 1.25 0.352 1.75 1.372 118 Exercício Segundo, estimamos os desvios padrão S ( p) 0.248 20 p 0.660 60 p 0.092 100 p 2 2 2 0,5 22.474 2 2 2 S (h) 0.108 0.75 h 0.540 1.25 h 0.352 1.75 h 0.316 119 0,5 Exercício Terceiro, estimamos a covariancia S (h, p) 0.106 0.75 h 20 p 0.139 1.25 h 20 p ... 4.641 120 Exercício Finalmente, o coef. de cor. Linear S (h, p) 4.641 r (h, p) 0.653 S ( p) S (h) 22.47 0.316 Existe uma forte associação linear entre o peso e a altura 121 Soma de variáveis estatísticas diversificação do risco 122 Soma de variáveis estatísticas • Até agora apenas somamos constantes com variáveis • É muito relevante no contexto da M.F. porque modeliza o comportamento estatístico das carteiras de activos partindo-se das propriedades individuais dos activos que a constituem. 123 Soma de variáveis estatísticas • Distribuição da soma. • Se as variáveis tiverem distribuição normal, então a soma também terá distribuição normal. • Se não tiverem, a soma será mais próxima da distribuição normal que as distribuições das parcelas. • A soma de + 30 variáveis aleatórias com distribuição desconhecida que sejam pouco correlacionadas, pode assumir-se que tem distribuição normal. 124 Soma de variáveis estatísticas • Média da soma. • Sendo que existem duas variáveis, X e Y, • a soma Z = X + Y terá como valor médio a soma dos valores médios de cada variável estatística. 125 Soma de variáveis estatísticas • Variância e desvio padrão da soma. • Sendo que existem duas variáveis, X e Y, • a soma Z = X + Y terá como variância a soma das variâncias de cada variável mais duas vezes a covariância. ( z) ( x) 2 ( x, y) ( y) 2 2 2 126 Exercício • Ex.2.16. Um intermediário de legumes, quando encomenda desconhece o preço de aquisição e de venda dos legumes PC ~ N(0.50€/kg, 0.10€/kg). • PV ~ N(0.60€/kg, 0.15€/kg). • Tem que pagar 75€ pelo transporte. • A correlação linear entre o preço de compra e de venda é de 0.5 • i) Determine qual vai ser o lucro de intermediar 1000kg de legumes. ii) Determine a probabilidade de ter prejuízo. 127 Exercício • Trata-se de operações algébricas com variáveis aleatórias. • Lucro = 1000(PV – PC) –75. PV – PC = N(0.60, 0.15) – N(0.50, 0.10) = N(0.60, 0.15) + N(– 0.50, 0.10) = N(0.10, (0.152+2(-0.5)0.150.10+0.102)) = N(0.10, 0.132) Troca o sinal da correlação porque está a subtrair 128 Exercício • Trata-se de operações algébricas com variáveis aleatórias. 1000 N(0.10, 0.132) = N(100, 132) N(100, 132) –75 = N(25, 132) No Excel, =NORMDIST(0; 25; 132;TRUE) Tenho 42.5% de probabilidade de ter prejuízo 129 Exercício • Ex.2.18. Vamos supor que o rendimento de uma família segue distribuição R = N(1250, 250) com tendência de aumentar 0.1% ao mês • Que a prestação da casa é P = V.(EURIBOR + 0.5/prazo)/12 em que a EURIBOR segue distribuição N(0.03, 0.01). • O coeficiente de correlação linear entre a EURIBOR e o rendimento é –0.2. 130 Exercício • O cálculo da prestação não é feito de forma correcta • Seria uma renda antecipada de duração limitada • Mas serve para ilustrar o uso das somas de variáveis aleatórias. 131 Exercício • i) Determine a evolução do rendimento disponível. • ii) Para um prazo de 50 anos, qual será o montante que implica que a probabilidade média de nos primeiros 60 meses do contrato o rendimento disponível ser maior que 750€ é 90%? 132 Exercício • i) Como RD = R – P = • N(1250, 250)x1.001t – V.[N(0.03, 0.01) + 0.5/prazo]/12 • Resulta uma distribuição normal com • Média = 1250 x1.001t– V.(0.03+0.5/prazo)/12 • Desvio padrão = [(250x1.001t)2 + + 2x0.2x250 x1.001t xVx0.01/12 + + (Vx 0.01/12)2]0,5 Troca o sinal da correlação porque está a subtrair 133 Exercício • ii) Implementei o modelo em Excel • Vou alterar o valor do empréstimo (F1) até a média da probabilidade dar 10% MRD = Média do rendimento disponível DPRD = Desvio Padrão do rendimento disponível 134 Exercício 135 Exercício • B2: =1250*1,001^A2-$F$1*0,04/12 • C2: =((250*1,001^A2)^2+2*0,2*250*1,001^A2 *$F$1*0,01/12+($F$1*0,01/12)^2)^0,5 • D2: =DIST.NORM(750;B2;C2;VERDADEIRO) • F2: =MÉDIA(D2:D61) • E depois copio em coluna. Finalmente, uso a ferramenta “atingir objectivo”, definir a célula F1 para o valor 0,1 por alteração da célula F2. 136 Exercício • Potenciais clientes com idade A = N(40, 10) anos pretendem fazer um seguro de vida em que alguém recebe 1000€ quando ele morrer que será com a idade M = N(75, 15) e que M é independente de A. – Numa seguradora “verdadeira”, o prémio é crescente com a idade de constituição do seguro. – A independência é para simplificar os cálculos 137 Exercício • Supondo que a seguradora capitaliza os prémios à taxa 3% ao ano e que prevê arranjar 1000 clientes não correlacionados entre si, determine, o prémio anual antecipado e igual para todos de forma que o lucro médio menos o desvio padrão do lucro seja positivo (traduz uma probabilidade de 85% do lucro ser positivo). 138 Exercício A duração do individuo será D = M – A = = N(75 – 40, (102+152)) = N(35, 18.03). A prestação será (de uma renda antecipada capitalizada para o futuro) P N N V . 1 (1 i ) .(1 i ).(1 i ) i P V .i 1 (1 i) .(1 i) N N 1 139 Exercício o lucro anual = Prémio – P que é uma variável aleatória de distribuição com forma funcional desconhecida mas com média Mi e desvio padrão DPi. Como vou somar o lucro de 1000 indivíduos não correlacionados, resulta uma distribuição normal N(1000Mi, 10000.5DPi). Vou agora usar o Excel 140 Exercício Nota2(8Nov): Surgiram dúvidas no cálculo do lucro da seguradora porque este apenas se concretiza quando o cliente morrer (ou desiste do seguro). No entanto, estou a considerar, sem perda de generalidade, que, em termos contabilísticos, a seguradora constitui reservas exactamente do valor da prestação necessária para capitalizar os 1000€ e considera o restante como lucro do exercício que distribui como dividendos. Também não estava claro no próximo exercício que cada “idade de morte” traduz o ponto médio de um intervalo de dez anos. 141 Exercício 142 Exercício • Calculava a dens. de probabilidade da duração, B2: =DIST.NORM(A2; 35;18,03;FALSO) • O Lucro em função da duração do cliente, =$F$2-(1000*0,03)/(1-1,03^-A2)/1,03^(A2+1) Na coluna B deveríamos ter probabilidades e temos densidades de probabilidade o que é equivalente quando os espaçamentos entre valores são unitários (ou idênticos). 143 Exercício • Calculava a média e o d.p. ponderados do lucro, D2: =C2*B2; E2: =B2*(D2-$D$73)^2 copiava em coluna; D73: =SOMA(D2:D71)/$B$73 e copiava em linha. 144 Exercício • • • • Calculava para os 1000 indivíduos, D74: =1000*D73; E74: =1000^0,5*E73; F74: =D74-E74 • Utilizava a ferramenta “atingir objectivo”, definir a célula F74 para o valor 0 por alteração da célula F2. 145