Risco e sua diversificação 1 Introdução • Quando alguém empresta um capital, tem como objectivo receber mais tarde esse capital que emprestou acrescido dos juros • Mas existe sempre uma probabilidade de não receber nem uma coisa nem outra (no todo ou em parte). 2 Introdução • Na análise de um investimento, porque é baseada em previsões quanto ao desempenho futuro do negócio – preços dos inputs, preços e quantidades dos outputs, depreciação do capital, falhas e descobertas tecnológicas • A medida calculada a priori na avaliação pode, a posteriori, vir a concretizar-se de forma menos favorável. 3 Introdução • No sentido de compreendermos o risco, controlá-lo e utilizá-lo na tomada de decisão, vamos neste capítulo apresentar a modelização estatística do risco. • Vamos necessitar de alguns conceitos estatísticos. 4 Conceitos estatísticos básicos 5 Conceitos estatísticos básicos • A Estatística descreve, organiza e relaciona objectos e fenómenos demasiado difíceis de apreender com as ferramentas conceptuais da matemática clássica (i.e., funções reais de variáveis reais). 6 Conceitos estatísticos básicos • A estatística reduz a dimensão do fenómeno considerando • poucas variáveis e • Conhecimento difuso dessas variáveis 7 Conceitos estatísticos básicos • Por exemplo, quando se constrói um avião, é necessário colocar bancos adequados para acomodar os deficientes / obesos. • Com é impossível saber as necessidades nos voos futuros, • Vamos medir, na população, a percentagem de obesos, • Vamos supor que 3% dos são obesos. 8 Conceitos estatísticos básicos • Partindo desta informação pouco pormenorizada, eu posso calcular, com a ajuda da estatística, qual as necessidades das viagens futuras. 9 Conceitos estatísticos básicos Percentagem de viagens 15% 10% 5% 0% 0 1 2 3 4 5 6 7 8 Número 9 10 11 12 de 13deficientes 14 15 Sabendo-se que 3% dos indivíduos são deficientes motores, em x% das viagens futuras (com 200 passageiros) haverá necessidade de N lugares 10 Conceitos estatísticos básicos • Num seguro de vida, o segurado paga um prémio por ano e a seguradora constitui reservas para fazer face à evolução da idade . • Se a seguradora souber a priori quantos anos faltam para o segurado morrer, calcula facilmente o prémio anual (capitalizava os prémios pagos mais uma margem). 11 Exercício • Ex.2.1. Um indivíduo com 35 anos e que vai morrer aos 85 anos pretende fazer um seguro de vida em que a viúva recebe 1000€ quando ele morrer. • Sendo que a seguradora aplica os prémios recebidos a uma taxa de juro de 3% ao ano e pretende uma margem de 10%, determine quanto deverá ser o prémio anual. 12 Exercício • R. Estamos em presença de uma renda antecipada que dura 50 anos a uma taxa de 3% ao ano. • Temos que determinar o prémio (i.e., a prestação anual) que faz esta renda valer 1000€ 13 Exercício P N N V . 1 (1 i ) .(1 i ).(1 i ) i V .i P N N 1 1 (1 i ) .(1 i ) 1000 0.03 50 51 1 1.03 1.03 8.61€ / ano 14 Conceitos estatísticos básicos • O prémio será as reservas mais 10%: P = 8.61€/ano + 0.86€/ano = 9.50€/ano 15 Conceitos estatísticos básicos • Mas, como o segurador não sabe a priori com que idade o segurado vai morrer, precisa de utilizar informação aproximada. 16 Noção de variável estatística 17 Noção de variável estatística • Uma variável estatística tem que • 1) ser passíveis de medição (ou de classificação). • 2) As variáveis seleccionadas têm que ser informativas, – não podem assumir valores iguais para todos os indivíduos: e.g., não interessa dizer que a pessoa tem duas pernas. 18 Noção de variável estatística • 3) São simplificações do fenómeno em estudo – descrevem características parcelares. 19 Noção de variável estatística • As variáveis podem ser • Cardinais: são comparáveis em ordem (1.5m é mais do que 1.0m) e em magnitude (1.5m é mais 0.5m que 1.0m). • Ordinais: são comparáveis em ordem (“bom estado” é melhor do que “estado razoável”) mas não em magnitude. • Categóricas: não são possíveis de comparar (azul não é comparável com vermelho). 20 Noção de variável estatística • Também podem ser • Quantitativas: traduzem quantidades; – E.g., peso, altura e temperatura • Qualitativas: traduzem qualidades. – E.g., cor, textura e suavidade. 21 Noção de variável estatística • Por questões de economia, apenas se consideram as variáveis estritamente necessárias para descrever o fenómeno/objecto em estudo com o detalhe pretendido. 22 Exercício • Ex.2.2. Uma instituição de crédito ao consumo pretende descrever os clientes (para distribuir pelos gestores de contas). Identifique algumas variáveis que considera relevantes na descrição dos clientes (e fáceis de obter). 23 Exercício • R. Nível de escolaridade, se está empregado, o rendimento mensal, estado civil, idade, se tem casa própria. – Não interessará saber a altura, o tamanho dos braços, etc. que seriam importantes para um alfaiate. 24 Noção de população / variável aleatória 25 Noção de população / variável aleatória • Identificadas as variáveis estatísticas que caracterizam cada indivíduo, a estatística irá responder (parcialmente) ao problema de não conhecermos a priori que valores vão assumir essas variáveis num indivíduo particular. 26 Noção de população / variável aleatória • Por exemplo, para quem compra casa a crédito, o seu esforço financeiro de um determinado mês depende do rendimento e da taxa de juro EURIBOR (que indexa a prestação). No entanto, no dia da compra, essas grandezas não são conhecidas, e.g., no futuro 240º mês de vigência do contrato de crédito. 27 Noção de população / variável aleatória • Em termos conceptuais vou preencher a falta de informação relativamente a um indivíduo particular assumindo que o meu indivíduo vai ser uma escolha aleatória da população a que pertence e da qual eu conheço os “valores médios”. 28 Noção de população / variável aleatória • No exemplo dos aviões, não sei se um cliente particular é deficiente motor ou não mas sei que cada cliente pertence a uma população em que 3% dos indivíduos são deficientes motores. 29 Noção de população / variável aleatória • Apesar de fisicamente, uma variável aleatória descrever um fenómeno que é intrinsecamente aleatório, por exemplo, a face que resulta de atirar uma moeda ar, • podemos, em termos conceptuais, imaginar que temos um processo aleatório em vez de uma falta de informação sobre um fenómeno determinístico (i.e., não aleatório). 30 Noção de população / variável aleatória • Vamos utilizar a “experiência estatística” de extracção aleatória de um indivíduo de uma população para materializar o conceito de variável aleatória. • Como não sei que valor a variável vai assumir no futuro para o meu indivíduo (e.g., qual vai ser o seu rendimento) vou extrair aleatoriamente um indivíduo de uma população em que existe dispersão no valor da variável. 31 Caracterização da população / variável aleatória 32 Caracterização da população / variável aleatória • Sendo que descrevemos os indivíduos por uma variável estatística, caracterizamos cada um pela medida que essa variável assume. • O modelo do risco vai assumir que o indivíduo desconhecido é retirado aleatoriamente de uma população, • Não será possível nem relevante caracterizar cada um dos indivíduos sendo suficiente ter alguma informação que caracterize a população. 33 Caracterização da população / variável aleatória • Como já referido, retirar o indivíduo aleatoriamente de uma população é equivalente a • Concretizar uma variável aleatória – Tipo “atirar uma moeda ao ar” 34 Variáveis discretas • Frequência relativa. No caso de a variável assumir um número pequeno de valores (i.e., uma variável discreta com poucos valores possíveis), eu posso caracterizar a população pela percentagem de indivíduos que assumem cada um dos valores possíveis. • Por exemplo, eu posso dizer que os Portugueses, 47% dos indivíduos são homens e 53% são mulheres. 35 Variáveis discretas • Haverá exemplos em que o número de casos possíveis é muito grande mas em que alguns casos (ou classes) concentram a quase totalidade dos indivíduos • No exemplo dos aviões, os valores abaixo de 15 concentram mais de 99.9% das “viagens” 36 Noção de extracção aleatória e de probabilidade • Entende-se que ocorre uma extracção aleatória quando a escolha do indivíduo é feita de forma independente das suas características. • Por exemplo, na escolha de um número do Euro-milhões é escolhida uma bola sem ter em atenção nenhuma das suas características (i.e., o seu número). 37 Noção de extracção aleatória e de probabilidade • O conceito de probabilidade associa-se à ideia de que eu vou retirar aleatoriamente um indivíduo de uma população. Em termos numéricos é igual à frequência relativa dos valores observados na população. 38 Noção de extracção aleatória e de probabilidade • Por exemplo, eu posso dizer que a probabilidade de numa viagem haver 6 deficientes motores é de 15.8% (ver Fig.2.1). • Quer esta grandeza dizer que, apesar de numa viagem específica “sair” um número qualquer de deficientes motores, se eu repetisse a extracção aleatória de muitas viagens, por exemplo, 500 milhares de milhões de vezes, então em 15.8% das vezes na viagem haveria 6 deficientes motores. 39 Noção de extracção aleatória e de probabilidade • Esta frequência relativa teórica, que em termos conceptuais se obtém pela repetição um número infindável de vezes da “experiência aleatória” (nas mesmas condições), é uma interpretação clássica do conceito de probabilidade (de ocorrência). • A soma da probabilidade de todos os casos possíveis é um. 40 Noção de extracção aleatória e de probabilidade • Ex.2.3. Quando se atira um dado ao ar, qual é a probabilidade de sair um 3? • E caso se atirem dois dados, qual é a probabilidade de somarem 3 pontos? 41 Noção de extracção aleatória e de probabilidade • i) Trata-se de uma “população teoricamente conhecida”: existem 6 casos possíveis e uma possibilidade de sair 3 pelo que a probabilidade é 1/6. • ii) Existem 36 casos possíveis, (1;1), (1;2), (1;3), (1;4), (1;5), (1;6), (2;1), (2;2), … e duas possibilidades de somar 3 pontos, (1;2) e (2;1), pelo que a probabilidade é 2/36 = 1/18. 42 Uso da informação populacional. • Sendo que eu tenho um modelo (por exemplo, de cálculo do prémio de um seguro de vida em função da idade de morte) onde posso transformar a informação sobre o indivíduo no resultado que pretendo mas não sei a priori essa informação (i.e., a idade de morte) 43 Uso da informação populacional. • Terei que utilizar em sua substituição a informação que tenho da população de onde o indivíduo vai ser extraído. • Mas agora, como terei que calcular um valor para cada elemento da população, vou também ter como resultado uma população (e não apenas um número normal). 44 Uso da informação populacional. • Ex.2.4. Um indivíduo com 35 anos pretende fazer um seguro de vida em que a viúva recebe 1000€ quando ele morrer. • Assuma-se que a seguradora capitaliza os prémios à taxa de 3% ao ano, que a probabilidade de o indivíduo morrer com 65 anos é de 70% e de morrer com 85 anos é de 30%. • Determine, se o prémio anual for de 20€, qual será o lucro anual da seguradora (dado pela diferença entre o prémio e a entrega necessária para capitalizar nos 1000€)? 45 Uso da informação populacional. • A renda (antecip.) necessária deveria resolver P N N V . 1 (1 i ) .(1 i ).(1 i ) i • Se morrer aos 85 anos, a entrega deverá ser 8.61€ pelo que o lucro será 20–8.61 = 11.39€/ano ; • Se morrer aos 65 anos, a entrega deverá ser 20.41€/ano pelo que o lucro será (um prejuízo) –0.41€/ano . 46 Uso da informação populacional. • Então, o lucro será uma extracção aleatória de uma população em está associado a 70% dos indivíduos um lucro de -0.41€/ano e a 30% dos indivíduos 11.39€/ano. • Podemos também dizer que o lucro é uma variável aleatória com 70% de probabilidade de se concretizar como -0.47€/ano e com 30% de probabilidade de se concretizar como 11.39€/ano. 47 Uso da informação populacional. • Ex.2.5. Estender o ex.2.4 probabilidades do quadro. assumindo as 48 Uso da informação populacional. • R. D6:=(B$1*$B$2)/(1-$D$2^-(B6$B$3))/$D$2^(B6-$B$3+1) E6: =B$4-D6 e copiava em coluna: 49 Uso da informação populacional. • O resultado de substituir a informação do individuo (que não temos) pela informação que temos sobre a população não permitirá ter uma resposta perfeita de qual deverá ser o prémio anual • Ainda assim, permite realizar cálculos algébricos e obter resultados que apesar de incertos podem melhorar a minha capacidade de decisão. 50 Uso da informação populacional. • Deve-se ter sempre em mente que, derivado de haver concorrência no mercado de seguros, será impraticável a seguradora impor um prémio que, seja qual for a posteriori a idade de morte, o lucro seja positivo • Existe sempre o risco de segurador ter prejuízo no contrato. 51 Uso da informação populacional. • Caracterização da população / Estimação das probabilidades. Obtenho as probabilidades de cada classe observando todos os “indivíduos” que formam a população. • Existem fenómenos em que esta operação é (teoricamente) possível, e.g., quando se retira uma carta de um baralho de 40 cartas, a probabilidade de sair uma em particular (e.g., o ás de copas) é de 2.5%. 52 Uso da informação populacional. • No entanto, na generalidade das situações não é possível observar todos os indivíduos. • Por exemplo, eu não posso observar para todos os indivíduos o tamanho de sapatos que usam. • Também, quando o nosso indivíduo vai ser concretizado no futuro, parte dos indivíduos (os do futuro) ainda não existem. 53 Uso da informação populacional. • Nos casos em que não é possível avaliar, por questões teóricas ou económicas, as propriedades de todos os indivíduos da população, teremos que nos contentar em estimar as propriedades recorrendo a uma amostra que contém apenas uma (pequena) parte dos indivíduos. 54 Uso da informação populacional. • A estimação terá associado um “pequeno” erro que resulta de os indivíduos de duas amostras não serem necessariamente os mesmos, erro esse que decresce com o aumento do tamanho da amostra. • A estatística permite prever qual será a ordem de grandeza do erro de assumir a estimativa como se fosse o parâmetro. 55 Uso da informação populacional. • Por exemplo, a probabilidade teórica de obter cada um dos números do Euromilhões é 2.04% (i.e., 1/49) • A estimativa calculada com uma amostra (de 10000 “indivíduos”) não é exactamente este valor. • No caso do 1 até 10: 56 Uso da informação populacional. Frequência relativa 2,3% 2,2% 2,1% 2,0% 1,9% 1,8% 1,7% 1,6% 0 1 2 3 4 5 6 7 8 9 Número 10 57 Variáveis contínuas • Frequência relativa (em intervalos). Quando o domínio da variável estatística é contínuo (i.e., um número real), existe uma quantidade infinita de casos possíveis pelo que a probabilidade de ocorrer um caso particular é zero. 58 Variáveis contínuas • Por exemplo, a probabilidade de encontrar uma pessoa que tenha 1.7643454323456434 metros de altura é zero. • Uma estratégia para ultrapassar este problema é dividir o domínio possível em intervalos e quantificar a frequência relativa dos indivíduos em cada um dos intervalos. • Por exemplo, fazemos uma divisão da EURIBOR nas classes [0 a 2%]; ]2% a 3%]; ]3% a 4%]; ]4% a 5%]; ]5% a 8%], e maior que 8%. 59 Variáveis contínuas • Vamos assumir, sem perda de generalidade, que a característica de todos os indivíduos de cada classe é valor médio da classe. Esse princípio não pode ser utilizado nas classes não limitadas (e.g., a classe “maior que 8%”). 60 Variáveis contínuas • Densidade de probabilidade. Se o comprimento de uma classe diminuir (e.g., for dividida ao meio) a probabilidade de cada uma das classes diminui até que, quando tiverem comprimento infinitesimal, a probabilidade se aproxima de zero (também será infinitesimal). 61 Variáveis contínuas • No sentido de construir uma medida que ultrapasse este enfraquecimento, dividimos a probabilidade pelo comprimento da classe. Essa nova medida denomina-se por densidade de probabilidade e existe como uma grandeza “grande” mesmo quando atribuída a um ponto. 62 Variáveis contínuas • Ex.2.6. Supondo que a probabilidade de a EURIBOR atingir determinado valor (de um intervalo) é [0 a 2%] 5%; ]2% a 3%] 15%; ]3% a 4%] 30%; ]4% a 5%] 35%; ]5% a 8%] 12% e ]8% a 11%] 3%, • determine as respectivas densidades de probabilidade. 63 Variáveis contínuas • • • • • • R. [0 a 2%] 2.5%/pp ; ]2% a 3%] 15%/pp ; ]3% a 4%] 30%/pp ; ]4% a 5%] 35%/pp ; ]5% a 8%] 4%/pp e ]8% a 11%] 1%/pp . 64 Variáveis contínuas • Função de Distribuição. Como num problema concreto as densidades de probabilidade da população são estimadas usando uma amostra, a divisão dos indivíduos pelas várias classes obriga a recolher amostras grandes. 65 Variáveis contínuas • Como, as probabilidades são previsões a priori sobre a concretização a posteriori do fenómeno em estudo, os valores próximos serão praticamente equivalentes. • Então, é teoricamente aceitável relacionar as densidades de probabilidade dos pontos (ou classes) vizinhos ajustando uma função contínua: a função de distribuição. 66 Variáveis contínuas • A forma funcional dessa f.d. terá uma justificação teórica para ser aplicada a um problema concreto, e é caracterizada por alguns (poucos) parâmetros (normalmente, um ou dois). • Desta forma, a estimação das densidades de probabilidade dos vários intervalos (e, nos limite, dos infinitos pontos) traduz-se na estimação de apenas um ou dois parâmetros. 67 Variáveis contínuas • Também podemos utilizar a função distribuição cumulativa F(x) que quantifica a probabilidade de ocorrência de um valor X menor ou igual a x: F(x) = p(X x). • A diferença F(b) – F(a) quantifica a probabilidade de ocorrência de um valor dentro do intervalo ]a, b], em que ser aberto ou fechado é numericamente irrelevante. 68 Distribuição Normal • É a distribuição mais importante porque é “a distribuição limite” que resulta de somarmos acontecimentos independentes (depois veremos o que este conceito representa). 69 Distribuição Normal • É caracterizada por dois parâmetros, o valor médio, , e o desvio padrão, , e tem a forma de um sino • São mais prováveis serem observados os valores próximos da média. • A probabilidade de o indivíduo extraído cair dentro do intervalo ] –; + ] é de 68% e de cair dentro do intervalo ] – 2; +2] é de 95%. 70 Distribuição Normal Densidade de probabildiade0,4 0,3 0,2 0,1 0,0 -3 -2 -1 0 1 2 x3 71 Distribuição Normal • Apesar de a expressão analítica da função densidade de probabilidade da Distribuição Normal ser muito complicada (tem forma exponencial) é muito importante porque caracteriza bem os fenómenos que resultam da soma de subfenómenos independentes. • É fácil a manipulação de variáveis que seguem esta distribuição. 72 Estimação do valor médio 73 Estimação do valor médio • Em termos económicos, o valor médio quantifica a “componente sem risco” do fenómeno que estamos a analisar. 74 Estimação do valor médio • É a medida que contém mais informação pelo que, se tivermos que atribuir apenas um valor a um indivíduo particular (desconhecido), será esta medida a que deve ser utilizada (ou outra medida de tendência central como, por exemplo, a mediana). 75 Média aritmética simples • Prova-se que, se os indivíduos forem igualmente representativos, o melhor estimador do valor médio é a média aritmética dos indivíduos da amostra. n x1 x2 ... xn x n x i 1 i n 76 Exercício • Ex.2.7. Um barco de investigação capturou em Janeiro de 1990 na zona pesqueira da Terra Nova 10 bacalhaus cujo peso foram (em kg) 15.5, 17.9, 21.3, 13.1, 9.5, 7.9, 3.5, 19.1, 23.3, 7.2 Em Janeiro de 2008 foram pescados outros 10 bacalhaus (usando a mesma técnica) cujo peso foram 10.4, 12.2, 11.1, 13.6, 9.2, 12.6, 6.1, 13.2, 12.3, 13.4 Que poderá dizer quanto à evolução da população de bacalhau? 77 Exercício • R. Estima-se que em Janeiro de 1990 o peso médio unitário dos bacalhaus era de 13.83kg e em Janeiro de 2008 era de 11.41kg. • Assim, as estimativas apontam no sentido da diminuição do peso médio unitário da população de bacalhau. 78 Propriedades A média do produto da constante a por uma variável X é igual ao produto da constante pela média aritmética da variável (corresponde a uma mudança de escala) _____ ___ ax a x 79 Propriedades A média da soma da constante a com a variável X é igual à soma da constante com a média da variável: _____ ___ ax a x 80 Propriedades A média da soma da variável X com a variável Y é igual à soma das médias das variáveis: _______ ___ ___ x y x y 81 Média aritmética ponderada • Existem casos em que cada individuo da amostra representa uma fatia diferente da população. • E.g., se na amostra recolhermos 10o pessoas do Porto e 100 de Lisboa, cada pessoa de Lisboa representa mais indivíduos. 82 Média aritmética ponderada • Será necessário ponderar cada individuo pela sua importância relativa. Sendo wi a importância relativa do individuo i, teremos w1 x1 w2 x2 ... wn xn x w1 w2 ... wn 83 Média aritmética ponderada • Ex.2.9. Num inquérito, (dados fictícios) e 32% dos portugueses e 72% dos espanhóis responderam que preferem o Obama ao McCain. • Obtenha uma estimativa (boa) para as preferências dos ibéricos. 84 Média aritmética ponderada • R. Como a Espanha tem 5 vezes mais população, então um inquirido em Espanha representa 5 vezes mais pessoas que um inquirido em Portugal pelo que as preferências médias são . 1 0.32 5 0.72 x 65.3% 1 5 85 Média aritmética ponderada • Média aritmética calculada com dados agrupados em classes • Quando recorremos a fontes, e.g. o INE, a informação está agregada por intervalos. • Pretende manter o anonimato dos indivíduos. 86 Média aritmética ponderada • No caso de os dados estarem agrupados por classes, a “melhor” média é a média aritmética ponderada em que é considerado os valores de cada classe como o ponto médio do intervalo e os pesos são as frequências relativas de cada classe. 87 Média aritmética ponderada • Um indivíduo com 35 anos pretende fazer um seguro de vida em que a viúva recebe 1000€ quando ele morrer. • As probabilidade de morrer, em intervalos de 10 anos, é dado e a taxa de desconte é 3%/ano. • Qual o lucro médio anual da seguradora se o prémio anual for de 50€,? 88 Média aritmética ponderada 89 Média geométrica simples • É utilizada para calcular taxa médias, e.g., taxa de juro médias • E.g. em 3 anos a EURIBOR foi (%/ano) • 4.51; 4.67 e 5,21 • Então a taxa média anual foi i (1 4.51%)(1 4.67%)(1 5,21%) 1 4,80% 1 3 90 Média geométrica simples • Sendo conhecidas as taxas de juros anualizadas de cada mês, determine a taxa de juro média anual. N3: =PRODUTO(B3:M3)^(1/12) N3: N3-1 91 Estimação do desvio padrão 92 Desvio padrão • Em termos económicos, o desvio padrão, , é uma medida do risco de assumirmos o valor médio da população como se fosse o valor associado ao indivíduo. 93 Desvio padrão • O desvio padrão é uma medida da heterogeneidade da população (a variabilidade em torno do valor médio). • Na Distribuição Normal, 68% dos indivíduos estão em ] –; + ] e 95% em ] – 2; +2]. 94 Desvio padrão • Sendo o valor médio da população, então o quadrado do desvio padrão, 2, vem dado por: x1 x2 2 2 2 ... xn 2 N 95 Propriedades do Desvio padrão • Se os indivíduos forem todos iguais, o desvio padrão é zero (a) 0 96 Propriedades do Desvio padrão • O desvio padrão do produto da constante a pela variável X é igual ao produto da constante pelo desvio padrão da variável: ( a x) a ( x) 97 Propriedades do Desvio padrão • O desvio padrão da soma de uma constante com uma variável X é igual ao desvio padrão da variável X. ( a x) ( x) 98 Estimação do Desvio padrão • Quando temos uma amostra, estima-se o desvio padrão como o desvio padrão amostral mas descontado de um grau de liberdade (perdido na estimação do valor médio - conceito a desenvolver em Estatística). 99 Estimação do Desvio padrão • Em termos algébricos, dividimos a soma dos desvios quadráticos dos indivíduos relativamente à média amostral por (n – 1) e achamos a sua raiz quadrada x1 x x2 x 2 S 2 ... xn x 2 n 1 100 Exercício • Voltando ao Ex.2.7 do bacalhau, construímos uma folha de cálculo com os dados D2: =(B2-B$12)^2 e copiava em linha e coluna B13: =(Soma(D2:D11)/(Contar(B2:B11)-1))^0,5 e copiava em linha. – Podia também usar a função =DesvPad(B2:B11), B16: = 1-Dist.Norm($B$15;B12;B13;VERDADEIRO). 101 102 Estimação do Desvio padrão • Desvio padrão ponderado e estimado com dados agrupados • Reutiliza-se a metodologia usada na estimação do valor médio w1 x1 x ... wn xn x w1 ... wn 2 S 2 103 Operações com variáveis • Agora estamos em condições de realizar operações de constantes com variáveis aleatórias. 104 Exercício • Ex.2.14. Compro os legumes a 0.50€/kg, pago 75€ pelo transporte e o preço de venda é desconhecido mas tem distribuição normal com média 0.60€/kg e desvio padrão de 0.15€/kg. • i) Determine qual vai ser o meu lucro de intermediar 1000kg de legumes. • ii) Determine a probabilidade de eu ter prejuízo. 105 Exercício i) Lucro = V.(Pvenda – Pcompra) – Ctransporte = 1000[N(0.60, 0.15) – 0.50] – 75 Lucro = N(600, 0.15x1000) – 575 = N(25, 150) ii) No Excel teríamos A1: =Dist.Norm(0; 25; 150; Verdadeiro) 43.38% 106 Diversificação do risco 107 Diversificação do risco • Neste ponto vou mostrar como um modelo estatístico nos pode ajudar a controlar o risco de uma actividade económica. • Em termos matemáticos, trata-se de operações de soma de variáveis. 108 Diversificação do risco • Em termos económicos trata-se de construir uma carteira de activos • “Não por os ovos todos no mesmo cesto” • Uma concretização negativa de um activo será estatisticamente compensada por uma concretização positiva de outro activo 109 Associação entre variáveis • Até este ponto, assumimos a existência de apenas uma variável. • No entanto, no geral usamos várias variáveis na caracterização de um indivíduo (no exemplo da pessoa usamos a cor da pele, do cabelo, etc.). 110 Associação entre variáveis • Algumas variáveis independentes estatísticas são – e.g., a cor do cabelo e o peso • Outras, sem deixarem de ser aleatórias, são dependentes – e.g., a altura e o peso: os indivíduos mais altos são, em média, os mais pesados. 111 Associação entre variáveis • Em termos económicos (em que o “individuo” é o período de tempo), existe um certo grau de dependência entre os investimentos • e.g., se fizer calor vendem-se mais gelados e menos camisolas. 112 Associação entre variáveis • No sentido de poder realizar operações algébricas com variáveis aleatórias (já o fizemos com uma variável aleatória e constantes), vamos modelizar a associação entre variáveis estatística – A definição de independência de variáveis é dada em Estatística I 113 Associação entre variáveis • Variável discreta: – Frequências relativas / probabilidades cruzadas (de classes) • A informação será semelhante à situação em que apenas temos uma variável estatística discreta (ou dividida em classes), mas agora serão classes conjuntas. 114 Associação entre variáveis • E.g, cruzamos a cor da pele com a cor de cabelo (duas variáveis qualitativas): Pele \ Cabelo Louro Castanho Escuro Loura 5% 3% 1% Morena 9% 45% 15% Mulata 0% 2% 12% Escura 0% 1% 7% 115 Associação entre variáveis • E.g, dividimos duas variáveis contínuas em classes: Altura peso \ ]0.0; 40.0] ]40.0; 80.0] ]80.0; 120.0] Total ]0.5; 1.0] 10.6% 0.2% 0.0% 10.8% ]1.0; 1.5] 13.9% 40.0% 0.1% 54.0% ]1.5; 2.0] 0.3% 25.8% 9.1% 35.2% Total 24.8% 66.0% 9.2% 100.0% 116 Associação entre variáveis • Nas tabelas que cruzam duas variáveis, a soma horizontal das frequências / probabilidades quantifica a percentagem de indivíduos que pertencem à correspondente classe das alturas enquanto que a soma vertical quantifica a percentagem de indivíduos que pertencem à correspondente classe dos pesos. 117 Associação entre variáveis • Variáveis contínuas : Covariância • A covariância é uma medida que condensa num só número a associação entre duas variáveis estatísticas. N ( x, y ) x i 1 i x yi y N 118 Associação entre variáveis • Os indivíduos podem representar apenas instantes de tempo diferentes, caso em quem podemos trocar o índice i por t. – E.g., a covariância entre a taxa EURIBOR (desconhecidas) em dois dias consecutivos. • A variância é um caso particular da covariância: 2 = (x, x) 119 Associação entre variáveis • A covariância pode ser negativa, zero ou positiva. • É crescente com os desvios padrão das variáveis 120 Associação entre variáveis • Coeficiente de correlação linear de Pearson, (x, y) • Retira à covariância o efeito dos desvios padrão ( x, y) ( x, y) ( x) ( y ) ( x, y) ( x, y) ( x) ( y) 121 Associação entre variáveis • Coeficiente de correlação linear está no intervalo [–1; 1] • Se for zero, as variáveis não estão associadas (linearmente). • Se for –1 ou 1, estão perfeitamente associados em sentido contrário ou no mesmo sentido, respectivamente. 122 Associação entre variáveis • O tem ainda outro significado. • O seu valor ao quadrado, conhecido por R2, quantifica quanto eu posso reduzir na variância de uma variável por conhecer a concretização da outra variável. 123 Associação entre variáveis • E.g, na população a variância do peso é 400, (o desvio padrão é 20 kg). Se eu souber que o entre a altura e o peso é 0.7, se eu conhecer a altura da pessoa, reduzo a variância do peso para 51% (i.e., o desvio padrão diminui para 14.28kg). 124 Associação entre variáveis • Propriedades da covariância e do coeficiente de correlação linear a) A covariância (e o coeficiente de correlação linear) entre duas constantes ou entre uma variável e uma constante é zero (a, b) = 0; (a,X) = 0 125 Associação entre variáveis b) Multiplicando uma das variáveis por uma constante diferente de zero, a covariância vem multiplicada e o coeficiente de correlação linear mantém-se (a menos do sinal): (a.X,Y) = a.(X,Y); (a.X,Y) = sig(a). (X,Y) 126 Associação entre variáveis c) Somando uma constante a uma das variáveis, a covariância e o coeficiente de correlação linear mantém-se: (a+X,Y) = (X,Y); (a+X,Y) = (X,Y) 127 Associação entre variáveis d) A covariância e o coeficiente correlação são comutativos: (X,Y) = (Y,X); (X,Y) = (Y,X) de 128 Associação entre variáveis Estimação da covariância e do coeficiente de correlação linear. Podemos usar uma amostra para estimar a associação entre as variáveis n S ( X ,Y ) x x y i 1 i i y n 1 129 Exercício Ex.2.15. Relativamente aos dados do quadro das alturas e dos pesos, determine a covariância e o coeficiente de correlação entre estas duas variáveis. Que pode dizer acerca do grau de associação? 130 Exercício Primeiro, estimamos os valores médios p 0.248 20 0.660 60 0.092 10 53.76 h 0.108 0.75 0.540 1.25 0.352 1.75 1.372 131 Exercício Segundo, estimamos os desvios padrão S ( p) 0.248 20 p 0.660 60 p 0.092 100 p 2 2 2 0,5 22.474 2 2 2 S (h) 0.108 0.75 h 0.540 1.25 h 0.352 1.75 h 0.316 132 0,5 Exercício Terceiro, estimamos a covariancia S (h, p) 0.106 0.75 h 20 p 0.139 1.25 h 20 p ... 4.641 133 Exercício Finalmente, o coef. de cor. Linear S (h, p) 4.641 r (h, p) 0.653 S ( p) S (h) 22.47 0.316 Existe uma forte associação linear entre o peso e a altura 134 Soma de variáveis estatísticas diversificação do risco 135 Soma de variáveis estatísticas • Até agora apenas somamos constantes com variáveis • É muito relevante no contexto da M.F. porque modeliza o comportamento estatístico das carteiras de activos partindo-se das propriedades individuais dos activos que a constituem. 136 Soma de variáveis estatísticas • Distribuição da soma. • Se as variáveis tiverem distribuição normal, então a soma também terá distribuição normal. • Se não tiverem, a soma será mais próxima da distribuição normal que as distribuições das parcelas. • A soma de + 30 variáveis aleatórias com distribuição desconhecida que sejam pouco correlacionadas, pode assumir-se que tem distribuição normal. 137 Soma de variáveis estatísticas • Média da soma. • Sendo que existem duas variáveis, X e Y, • a soma Z = X + Y terá como valor médio a soma dos valores médios de cada variável estatística. 138 Soma de variáveis estatísticas • Variância e desvio padrão da soma. • Sendo que existem duas variáveis, X e Y, • a soma Z = X + Y terá como variância a soma das variâncias de cada variável mais duas vezes a covariância. ( z) ( x) 2 ( x, y) ( y) 2 2 2 139 Exercício • Ex.2.16. Um intermediário de legumes, quando encomenda desconhece o preço de aquisição e de venda dos legumes PC ~ N(0.50€/kg, 0.10€/kg). • PV ~ N(0.60€/kg, 0.15€/kg). • Tem que pagar 75€ pelo transporte. • A correlação linear entre o preço de compra e de venda é de 0.5 • i) Determine qual vai ser o lucro de intermediar 1000kg de legumes. ii) Determine a probabilidade de ter prejuízo. 140 Exercício • Trata-se de operações algébricas com variáveis aleatórias. • Lucro = 1000(PV – PC) –75. PV – PC = N(0.60, 0.15) – N(0.50, 0.10) = N(0.60, 0.15) + N(– 0.50, 0.10) = N(0.10, (0.152+2(-0.5)0.150.10+0.102)) = N(0.10, 0.132) Troca o sinal da correlação porque está a subtrair 141 Exercício • Trata-se de operações algébricas com variáveis aleatórias. 1000 N(0.10, 0.218) = N(100, 217.9) N(100, 217.9) –75 = N(25, 217.9) No Excel, =NORMDIST(0; 25; 217,9;TRUE) Tenho 45.43% de probabilidade de ter prejuízo 142 Exercício • Ex.2.18. Vamos supor que o rendimento de uma família segue distribuição R = N(1250, 250) com tendência de aumentar 0.1% ao mês • Que a prestação da casa é P = V.(EURIBOR + 0.5/prazo)/12 em que a EURIBOR segue distribuição N(0.03, 0.01). • O coeficiente de correlação linear entre a EURIBOR e o rendimento é –0.2. 143 Exercício • O cálculo da prestação não é feito de forma correcta • Seria uma renda antecipada de duração limitada • Mas serve para ilustrar o uso das somas de variáveis aleatórias. 144 Exercício • i) Determine a evolução do rendimento disponível. • ii) Para um prazo de 50 anos, qual será o montante que implica que a probabilidade média de nos primeiros 60 meses do contrato o rendimento disponível ser maior que 750€ é 90%? 145 Exercício • i) Como RD = R – P = • N(1250, 250)x1.001t – V.[N(0.03, 0.01) + 0.5/prazo]/12 • Resulta uma distribuição normal com • Média = 1250 x1.001t– V.(0.03+0.5/prazo)/12 • Desvio padrão = [(250x1.001t)2 + + 2x0.2x250 x1.001t xVx0.01/12 + + (Vx 0.01/12)2]0,5 Troca o sinal da correlação porque está a subtrair 146 Exercício • ii) Implementei o modelo em Excel • Vou alterar o valor do empréstimo (F1) até a média da probabilidade dar 10% MRD = Média do rendimento disponível DPRD = Desvio Padrão do rendimento disponível 147 Exercício 148 Exercício • B2: =1250*1,001^A2-$F$1*0,04/12 • C2: =((250*1,001^A2)^2+2*0,2*250*1,001^A2 *$F$1*0,01/12+($F$1*0,01/12)^2)^0,5 • D2: =DIST.NORM(750;B2;C2;VERDADEIRO) • F2: =MÉDIA(D2:D61) • E depois copio em coluna. Finalmente, uso a ferramenta “atingir objectivo”, definir a célula F1 para o valor 0,1 por alteração da célula F2. 149 Exercício • Potenciais clientes com idade A = N(40, 10) anos pretendem fazer um seguro de vida em que alguém recebe 1000€ quando ele morrer que será com a idade M = N(75, 15) e que M é independente de A. – Numa seguradora “verdadeira”, o prémio é crescente com a idade de constituição do seguro. – A independência é para simplificar os cálculos 150 Exercício • Supondo que a seguradora capitaliza os prémios à taxa 3% ao ano e que prevê arranjar 1000 clientes não correlacionados entre si, determine, o prémio anual antecipado e igual para todos de forma que o lucro médio menos o desvio padrão do lucro seja positivo (traduz uma probabilidade de 85% do lucro ser positivo). 151 Exercício A duração do individuo será D = M – A = = N(75 – 40, (102+152)) = N(35, 18.03). A prestação será (de uma renda antecipada capitalizada para o futuro) P N N V . 1 (1 i ) .(1 i ).(1 i ) i P V .i 1 (1 i) .(1 i) N N 1 152 Exercício o lucro anual = Prémio – P que é uma variável aleatória de distribuição com forma funcional desconhecida mas com média Mi e desvio padrão DPi. Como vou somar o lucro de 1000 indivíduos não correlacionados, resulta uma distribuição normal N(1000Mi, 10000.5DPi). Vou agora usar o Excel 153 Exercício Nota2(8Nov): Surgiram dúvidas no cálculo do lucro da seguradora porque este apenas se concretiza quando o cliente morrer (ou desiste do seguro). No entanto, estou a considerar, sem perda de generalidade, que, em termos contabilísticos, a seguradora constitui reservas exactamente do valor da prestação necessária para capitalizar os 1000€ e considera o restante como lucro do exercício que distribui como dividendos. Também não estava claro no próximo exercício que cada “idade de morte” traduz o ponto médio de um intervalo de dez anos. 154 Exercício 155 Exercício • Calculava a dens. de probabilidade da duração, B2: =DIST.NORM(A2; 35;18,03;FALSO) • O Lucro em função da duração do cliente, =$F$2-(1000*0,03)/(1-1,03^-A2)/1,03^(A2+1) Na coluna B deveríamos ter probabilidades e temos densidades de probabilidade o que é equivalente quando os espaçamentos entre valores são unitários (ou idênticos). 156 Exercício • Calculava a média e o d.p. ponderados do lucro, D2: =C2*B2; E2: =B2*(D2-$D$73)^2 copiava em coluna; D73: =SOMA(D2:D71)/$B$73 e copiava em linha. 157 Exercício • • • • Calculava para os 1000 indivíduos, D74: =1000*D73; E74: =1000^0,5*E73; F74: =D74-E74 • Utilizava a ferramenta “atingir objectivo”, definir a célula F74 para o valor 0 por alteração da célula F2. 158