Estatística Aplicada (Aula 1) Estatística Aplicada Prof. Afonso Chebib 1 Enquete Formação acadêmica Profissão Interesses Estatística Aplicada Prof. Afonso Chebib 2 Expectativas O que você quer aprender nesta disciplina? O que você quer rever? Ampla abrangência: – Tesouraria/Área financeira de empresas – Banco/Mercado financeiro – Finanças pessoais Estatística Aplicada Prof. Afonso Chebib 3 Objetivo do curso Aprimorar os conceitos estatísticos básicos – Medidas de tendência e dispersão – Probabilidade – Intervalo de confiança – Regressão Linear Aplicação dos conceitos estatísticos ao setor financeiro – Administração de portfólio – Análise de risco e retorno – Determinação do beta (modelo CAPM) Estatística Aplicada Prof. Afonso Chebib 4 Estrutura / Plano de aula Horário: – 19h 00min às 23h c/ intervalo: 20h 45min às 21h Estatística Aplicada Prof. Afonso Chebib 5 Avaliação Prova Final ....................................................................... 60% – Todo o conteúdo do curso Listas de Exercícios.......................................................... 40% Estatística Aplicada Prof. Afonso Chebib 6 Faltas Chamada será feita antes do intervalo Não haverá abono de falta sem justificativa aceita legalmente – Atestado médico Estatística Aplicada Prof. Afonso Chebib 7 Bibiografia Recomendada SALVATORI, B. V. Estatística Aplicada. São Paulo: Edicon, 2007. LARSON, R e FARBER, B. Estatística Aplicada. São Paulo: Pearson, 2007. FREUND, J. E. Estatística Aplicada – Economia, Administração e Contabilidade. São Paulo: Martins Fontes, 2007. Estatística Aplicada Prof. Afonso Chebib 8 Curiosidades Estatísticas Lei de Benford ou Lei dos Primeiros Dígitos Problema de Monty Hall Problema das gavetas Probabilidade de aniversário no mesmo dia Estatística Aplicada Prof. Afonso Chebib 9 Lei de Benford Estatística Aplicada Prof. Afonso Chebib 10 Problema de Monty Hall Origem: concurso televisivo americano da década de 70 3 portas fechadas escondem apenas um premio Concorrente escolhe uma porta Apresentador abre uma das outras duas portas e mostra que ela esta vazia e pergunta: Você mantém sua porta ou prefere trocar? Questão: Vale a pena trocar ou é indiferente? Intuição x realidade Estatística Aplicada Prof. Afonso Chebib 11 Problemas das Gavetas 3 gavetas contém 8 bolas cada. Gaveta 1: 8 bolas brancas Gaveta 2: 4 bolas brancas e 4 pretas Gaveta 3: 8 bolas pretas Abre-se uma gaveta ao acaso e retira-se uma bola. Sendo a bola branca, qual a probabilidade de ser a gaveta 1? Estatística Aplicada Prof. Afonso Chebib 12 Aniversário no mesmo dia K pessoas Probabilidade 5 3% 10 12% 15 25% 20 41% 25 57% Estatística Aplicada 30 71% 40 89% Prof. Afonso Chebib 45 94% 50 97% 13 Estatística O que é? – Ciência que se preocupa com a coleta, organização, análise, apresentação, e interpretação de dados. Estatística descritiva: Ramo que trata da organização, do resumo e da apresentação dos dados. Inferência estatística: Ramo que trata de tirar conclusões sobre uma população a partir de uma amostra. A ferramenta básica no estudo da estatística inferencial é a probabilidade. Estatística Aplicada Prof. Afonso Chebib 14 Estatística População População: é o conjunto de todos os elementos de interesse de um determinado estudo Amostra Estatística Aplicada Prof. Afonso Chebib Uma amostra é um subconjunto da população (pesquisa amostral) 15 Estatística Parâmetro: é uma descrição numérica de uma característica da população Estatística: é uma descrição numérica de uma característica da amostra Exemplo: Deseja-se estudar o salário médio dos moradores de um determinado edifício. População: todos os moradores do edifício Amostra: Uma fração dos moradores do edifício Estatística Aplicada Prof. Afonso Chebib 16 Estatística Dados – fatos e números coletados, analisados e sintetizados para apresentação e interpretação – provenientes de observações, contagens, medidas ou respostas. Estatística Aplicada Prof. Afonso Chebib 17 Estatística descritiva Sintetizando os dados qualitativos – Distribuição de frequência • É um sumário tabular de dados que mostra o número (frequência) de itens de cada uma das diversas classes não sobrepostas Situação: o gerente de uma agência bancária deseja conhecer a principal categoria de investimentos em que seus clientes estão dispostos a alocar a maioria de seus recursos no atual momento Estatística Aplicada Prof. Afonso Chebib 18 Estatística Estatística Aplicada Prof. Afonso Chebib 19 Estatística descritiva Investimento Renda Fixa Renda Variável Multimercado Outros Total Freq. Absoluta 21 16 8 5 50 Freq. Relativa 42,00% 32,00% 16,00% 10,00% 100,00% Freq. Acumulada 42,00% 74,00% 90,00% 100,00% Frequência relativa: fração ou proporção dos itens pertencentes a uma classe. Frequencia relativa = Frequencia da classe n Estatística Aplicada Prof. Afonso Chebib 20 Estatística descritiva Gráfico em setores (gráfico de “pizza”) Estatística Aplicada Gráfico de barras Prof. Afonso Chebib 21 Estatística descritiva Sintetizando os dados Quantitativos – Definindo a distribuição de frequência para dados quantitativos 1. Determinar o número de classes não sobrepostas 2. Determinar a amplitude das classes 3. Determinar o limite das classes Estatística Aplicada Prof. Afonso Chebib Situação: pesquisa levanta o tempo, em dias, para a conclusão da auditoria de fim de ano em algumas agências Tempo (em dias) para conclusão da auditoria de final de ano 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13 22 Estatística descritiva 1. 2. Numero de classes Amplitude das classes Amplitude = aprox. de uma clase 3. Maior valor - Menor valor Número de classes Limite das classes – Limite inferior = menor valor possível – Limite inferior = maior valor possível Estatística Aplicada Prof. Afonso Chebib 23 Estatística descritiva Distribuição de frequencia Tempo para conclusão da auditoria (em dias) Frequencia 10 - 14 4 15 - 19 8 20 - 24 5 25 - 29 2 30 - 34 1 TOTAL 20 Frequencia Relativa 20% 40% 25% 10% 5% 100% Estatística Aplicada Prof. Afonso Chebib 24 Estatística descritiva Histograma Estatística Aplicada Prof. Afonso Chebib – Gráfico com a variável de interesse no eixo horizontal e a frequencia (absoluta ou relativa) no eixo vertical – Cada barra representa o limite da classe 25 Estatística descritiva Utilidade do Histograma – Fornecer informações sobre a forma ou formato da distribuição. Estatística Aplicada Prof. Afonso Chebib 26 Estatística descritiva Medidas de posição (tendência central) – Moda – Mediana – Média Estatística Aplicada Medidas de dispersão (variabilidade) – Amplitude – Variância – Desvio padrão – Coeficiente de variação Prof. Afonso Chebib 27 Estatística descritiva Medidas de posição – Moda: • Valor mais frequente na amostra (pode não existir, ou possuir mais de uma moda) – Mediana: • Valor central de um conjunto de dados ordenados – Para um número impar de observações é o valor intermediário – Para um número par de observações, é a média dos valores intermediário Estatística Aplicada Prof. Afonso Chebib – Média: 28 Estatística descritiva Media ponderada: é a média de um conjunto de dados cujas entradas tem pesos variáveis. Outros tipos de média: Média harmônica, média geométrica, etc... Estatística Aplicada Prof. Afonso Chebib 29 Exemplos Um fundo imobiliário possui 5 ativos descritos na tabela: ATIVO Área (m2) Valor de Mercado A 1500 16.500.000 B 2300 17.250.000 C 1000 8.500.000 D 3000 19.500.000 E 1200 12.000.000 Estatística Aplicada Prof. Afonso Chebib Qual o valor médio do metro quadrado dos ativos desse fundo? 30 Exemplos Primeiro passo: Calcular o valor por m2 de cada ativo Segundo passo: Calcular a média ponderada dos valores ATIVO A B C D E Área (m2) Valor de Mercado R$/M2 1500 16.500.000 11.000 2300 17.250.000 7.500 1000 8.500.000 8.500 3000 19.500.000 6.500 1200 12.000.000 10.000 valor medio Estatística Aplicada 8.194 Formula para calculo: =SOMARPRODUTO(área;preço)/SOMA(área) Prof. Afonso Chebib 31 Estatística descritiva Medidas de dispersão – Amplitude: Maior valor (-) Menor valor Características: •Simples; •Muito afetada por outliers; •Não considera a distribuição dos dados Estatística Aplicada Prof. Afonso Chebib 32 Estatística descritiva Medidas de dispersão – Variância • Medida de variabilidade que utiliza todos os dados • Diferença entre cada observação e a média • Variância amostral: Estatística Aplicada Prof. Afonso Chebib 33 Estatística descritiva Medidas de Dispersão – Desvio Padrão (DP) Estatística Aplicada Prof. Afonso Chebib Características: •Variância e desvio padrão medem a dispersão em torno da média •O DP mantém a unidade original dos dados 34 Estatística descritiva Medidas de dispersão – Coeficiente de variação • Tamanho do desvio padrão em relação a média • Porcentagem CV = Estatística Aplicada Prof. Afonso Chebib Desvio Padrão Média Características: •Medida relativa de dispersão; •Útil para comparar a variabilidade de dados expressos em unidades distintas; •Útil para comparar a variabilidade de dados que são expressos nas mesmas unidades, porém apresentam valores distintos 35 Exemplo Cálculo da variância, desvio padrão e coeficiente de variação dos alunos de 2 escolas: ESCOLA 1 Sala Qtt Estudantes Desvio Desvio^2 1 46 2 4 2 54 10 100 3 42 -2 4 4 46 2 4 5 32 -12 144 soma 220 0 256 média 44 Variancia 64 Desvio Padr 8 Coef. Var 0,182 Estatística Aplicada Prof. Afonso Chebib ESCOLA 2 Sala Qtt Estudantes Desvio 1 115 12,8 2 101 -1,2 3 107 4,8 4 98 -4,2 5 90 -12,2 soma 511 0 média 102,2 Variancia 88,7 Desvio Padr 9,42 Coef. Var 0,092 Desvio^2 163,84 1,44 23,04 17,64 148,84 354,8 Questão: Qual escola apresenta maior variabilidade? Se multiplicarmos o valor dos alunos da escola 2 por 100 o que acontece com os parametros? 36 Exemplo ESCOLA 2 Sala Qtt Estudantes Desvio Desvio^2 1 115 12,8 163,84 2 101 -1,2 1,44 3 107 4,8 23,04 4 98 -4,2 17,64 5 90 -12,2 148,84 soma 511 0 354,8 média 102,2 Variancia 88,7 Desvio Padr 9,42 Coef. Var 0,092 ESCOLA 2 x 100 Sala Qtt Estudantes Desvio Desvio^2 1 11.500 1280 1638400 2 10.100 -120 14400 3 10.700 480 230400 4 9.800 -420 176400 5 9.000 -1220 1488400 soma 51.100 0 3548000 média 10.220 Variancia 887.000 var2/var1 Desvio Padr 942 desv2/desv1 Coef. Var 0,092 10.000 100 Estatística Aplicada Prof. Afonso Chebib 37 Estatística descritiva Estatística Aplicada Prof. Afonso Chebib 38 Estatística descritiva Medidas de dispersão – Desvio padrão Para que serve em finanças? Dispersão = Incerteza = Risco Estatística Aplicada Prof. Afonso Chebib 39 Risco Financeiro Definição de Risco – Dicionário Houaiss: • “1. Probabilidade de perigo, com ameaça física para o homem e/ou para o meio ambiente; • 2. Probabilidade de insucesso, de malogro de determinada coisa, em função de acontecimento eventual, cuja ocorrência não depende exclusivamente da vontade dos interessados.” Estatística Aplicada Todos os ativos financeiros deverão produzir fluxos de caixa e o risco de um ativo ‘julgado em termos do risco de seus fluxos de caixa Prof. Afonso Chebib 40 Exemplo Ativos mais e menos voláteis, qual o significado e sua relação com 07/06/2013 51.618,63 2,1322 -2,42% o risco? 06/06/2013 52.884,83 2,1222 0,16% Data Ibov 18/07/2013 47.656,92 Dolar 2,2246 Var Ibov 0,53% 0,47% -0,39% 05/06/2013 52.798,63 2,1304 -2,28% -0,07% 04/06/2013 54.017,90 2,1285 0,14% 0,08% 53.944,36 2,1268 0,82% -0,70% Var Dolar 0,09% 17/07/2013 47.407,31 2,2263 1,14% -1,23% 03/06/2013 16/07/2013 46.869,29 2,2539 0,28% 1,34% 31/05/2013 53.506,08 2,1418 -2,09% 1,35% 15/07/2013 46.738,90 2,2240 2,61% -1,88% 29/05/2013 54.634,69 2,1131 -2,53% 1,88% 12/07/2013 45.533,24 2,2663 -2,37% 0,34% 28/05/2013 56.036,26 2,0738 -0,64% 0,86% 11/07/2013 46.626,26 2,2585 2,48% -0,62% 27/05/2013 56.395,94 2,0560 -0,02% 0,20% 10/07/2013 45.483,43 2,2726 0,90% 0,61% 24/05/2013 56.406,21 2,0518 0,10% 0,32% 08/07/2013 45.075,50 2,2587 -0,30% -0,02% 23/05/2013 56.349,91 2,0453 -0,14% -0,20% 05/07/2013 45.210,49 2,2591 -1,22% 0,10% 22/05/2013 56.429,27 2,0493 0,29% 0,60% 04/07/2013 45.763,16 2,2568 1,58% -0,52% 21/05/2013 56.265,32 2,0369 1,01% -0,14% 03/07/2013 45.044,03 2,2685 -0,41% 0,83% 20/05/2013 55.700,77 2,0398 0,97% 0,08% 17/05/2013 55.164,27 2,0381 0,71% 0,51% 02/07/2013 45.228,95 2,2498 -4,33% 0,84% 16/05/2013 54.772,62 2,0278 -0,30% 0,20% 01/07/2013 47.229,59 2,2309 -0,48% -0,02% 15/05/2013 54.936,41 2,0238 0,49% 0,16% 28/06/2013 47.457,13 2,2314 -0,32% 1,62% 14/05/2013 54.666,82 2,0205 0,40% 0,57% 27/06/2013 47.609,46 2,1955 0,92% 0,29% 13/05/2013 54.447,77 2,0090 -1,20% -0,75% 26/06/2013 47.171,98 2,1892 0,59% -1,02% 10/05/2013 55.107,80 2,0241 -0,61% 0,43% 55.447,56 2,0155 -0,64% 0,63% 25/06/2013 46.893,04 2,2117 2,00% -0,68% 09/05/2013 24/06/2013 45.965,05 2,2269 -2,35% -0,77% 08/05/2013 55.804,80 2,0028 -0,84% -0,22% 07/05/2013 56.274,66 2,0072 1,51% -0,25% 06/05/2013 55.429,88 2,0123 -0,10% 0,16% 03/05/2013 55.488,08 2,0091 0,30% -0,03% 02/05/2013 55.321,93 2,0098 -1,06% 0,45% 30/04/2013 55.910,37 2,0008 1,85% -0,19% 29/04/2013 54.887,25 2,0046 1,16% 0,29% 26/04/2013 54.252,04 1,9988 -1,30% -0,15% 25/04/2013 54.963,32 2,0019 -0,04% -0,60% 24/04/2013 54.984,23 2,0138 1,51% 0,77% 21/06/2013 47.056,04 2,2442 -2,43% -0,59% 20/06/2013 48.214,43 2,2574 0,67% 1,66% 19/06/2013 47.893,06 2,2202 -3,23% 1,92% 18/06/2013 49.464,94 2,1779 0,76% 0,56% 17/06/2013 49.088,65 Estatística 2,1658 -0,50% 0,85% 14/06/2013 49.332,34 2,1474 -2,17% 0,67% 13/06/2013 50.414,89 2,1330 2,48% -0,97% Prof. Afonso Chebib 12/06/2013 49.180,58 2,1537 -1,19% 0,83% 11/06/2013 49.769,93 2,1358 -3,06% -0,55% 10/06/2013 51.316,65 2,1475 -0,59% 0,72% Aplicada Desvio Padráo 41 Comparação das distribuições: Ibovespa x Dólar Estatística Aplicada Prof. Afonso Chebib 42 Comparação das distribuições: Ibovespa x Dólar Estatística Aplicada Prof. Afonso Chebib 43 Comparação das distribuições: Ibovespa x Dólar Estatística Aplicada Prof. Afonso Chebib 44 Comparação das distribuições: Ibovespa x Dólar Estatística Aplicada Prof. Afonso Chebib 45 Estatística descritiva Covariância – A Covariância é uma medida que avalia como as variáveis X e Y se movimentam ao mesmo tempo, em relação a seus valores médios. Indica a simetria existente entre X e Y S x, y (x i x )( y i y ) n 1 Estatística Aplicada Prof. Afonso Chebib 46 Estatística descritiva Estatística Aplicada Prof. Afonso Chebib 47 Estatística descritiva Covariância Estatística Aplicada 1 2 3 4 5 6 7 8 9 10 Número de Comerciais (x) 2 5 1 3 4 1 5 3 4 2 Diagrama de Dispersão 65 60 55 Vendas Semana Volume de vendas (y) (R$ 100) 50 57 41 54 54 38 63 48 59 46 50 45 40 35 0 1 2 3 4 5 6 Número de comerciais Prof. Afonso Chebib 48 Estatística descritiva Soma Estatística Aplicada Prof. Afonso Chebib S x, y x y 2 5 1 3 4 1 5 3 4 2 30 50 57 41 54 54 38 63 48 59 46 510 (x i x (-) media x y (-) media y (x-med x)(y- med y) -1 2 -2 0 1 -2 2 0 1 -1 0 1 12 20 0 3 26 24 0 8 5 99 x )( y i y ) n 1 -1 6 -10 3 3 -13 12 -3 8 -5 0 99 = 11 10-1 49 Estatística descritiva Covariância – Se positiva indica relação linear positiva entre x e y (graf. 1) – Se negativa indica relação linear negativa entre x e y (graf. 2) – Se próximo de zero, não há associação linear entre x e y (graf.3) Gráfico 1 Gráfico 3 y y Gráfico 2 y x Estatística Aplicada x x Prof. Afonso Chebib 50 Estatística descritiva Correlação (coeficiente de correlação linear) – Medida de associação linear que varia de -1 a +1 – Cuidado! É uma medida de associação e não de causa. Uma correlação elevada entre duas variáveis não significa que alterações havidas em uma variável provocarão alterações na outra variável Estatística Aplicada Prof. Afonso Chebib 51 Estatística descritiva Correlação (r) – Assume valores entre -1 e +1 • Se r é aproximadamente +1, associação linear positiva forte • Se r é igual a zero, ausência de associação linear • Se r é aproximadamente -1, associação linear negativa forte Estatística Aplicada Prof. Afonso Chebib 52 Estatística descritiva Estatística Aplicada Prof. Afonso Chebib 53 Estatística Descritiva Em finanças: Qual o efeito de se adicionar ativos com relação positiva ou negativa a uma carteira? -Voltando ao exemplo: dolar x bolsa: Gráfico de disperção Estatística Aplicada Prof. Afonso Chebib Correlação: -0,42 54