Estatística para Negócios Gerson Bronstein, M.Sc. Mônica Barros, D.Sc. Julho de 2002 Quem somos nós? Mônica Barros Doutora em Séries Temporais – PUC-Rio Mestre em Estatística – University of Texas at Austin, EUA Bacharel em Matemática – University of Washington, Seattle, EUA Professora da PUC-Rio (Depto. De Eng. Elétrica) e IBMEC, Consultora, ex-gerente de risco da EL Paso Merchant e ex-assistente do Presidente da PETROS. E-mail: [email protected], [email protected] Home page: http://www.mbarros.com 2 Quem somos nós? Gerson Bronstein Mestre em Administração, COPPEAD/UFRJ Mestre em Engenharia Elétrica, COPPE/UFRJ Engenheiro Eletrônico, UFRJ Coordenador Acadêmico e Professor das disciplinas Métodos Quantitativos e Gestão Financeira dos Programas In-Company do Ibmec Possui mais de 15 anos de experiência como pesquisador do Núcleo de Computação Eletrônica da UFRJ na área de Engenharia de Computação Atuou por mais de 5 anos como professor da Escola de Engenharia e Instituto de Matemática da UFRJ, em disciplinas relacionadas à Engenharia de Computação e Sistemas Atuou também como consultor em empresas como Booz, Allen e Hamilton e K2 Achievements 3 Sumário Apresentação do curso Estatística descritiva Análise multivariada Introdução à probabilidade Distribuições discretas de probabilidade Distribuições contínuas de probabilidade Distribuições amostrais e Intervalos de Confiança Testes de hipóteses Regressão Linear 4 Apresentação do curso 3 aulas expositivas (16hs) Objetivos Apresentar os conceitos básicos de probabilidade e estatística Fornecer instrumentos quantitativos de suporte às demais disciplinas do curso Disponibilizar ferramentas de apoio – HP-12C e Excel 5 Apresentação do curso Bibliografia de apoio Zentgraf, Roberto – Estatística Objetiva, 1a ed., ZTG Editora ([email protected]) – livro texto Barros, M – Probabilidade: um curso introdutório – Editora Papel Virtual, Rio de Janeiro Anderson, Sweeney e Williams – Statistics for Business and Economics, 8a ed., South-Western College Publishing Levine, Berenson e Stephan - Estatística: Teoria e Aplicações usando Microsoft Excel em Português – LTC Editora, Rio de Janeiro 6 Estatística Descritiva É um um conjunto de técnicas e procedimentos destinados à apresentação e descrição sumária de um conjunto de dados (amostra) Os elementos da amostra são apresentados em tabelas ou gráficos, sendo que estes últimos permitem observar algumas características particulares do conjunto de dados Os dois principais conjuntos de informações descritivas acerca de uma amostra são as medidas de posição / tendência central e as medidas de dispersão 7 Organizando e apresentando os dados Distribuição de freqüências – agrupamento de dados em classes (ou categorias) e suas respectivas freqüências ( ou número de ocorrências) Cada categoria é definida pelos seus limites inferior e superior O número de classes deve ser tal que permita a obtenção de informações a respeito da amostra – evite um número muito grande ou muito pequeno de classes Sempre que possível, utilize classes de mesma amplitude Histogramas – Uma forma de representação gráfica da distribuição de freqüências Outras formas de representação gráfica: gráfico de torta, gráficos de ogiva (polígono de freqüências) 8 Organizando e apresentando os dados – exemplo – velocidade de carros na BR 101 63 78 87 91 101 107 69 80 87 96 102 110 69 81 88 98 103 111 75 83 89 98 103 111 75 83 90 98 104 114 76 84 90 99 105 115 76 84 90 100 105 115 77 85 90 101 107 116 78 86 90 101 107 117 78 86 91 101 107 118 9 Organizando e apresentando os dados – exemplo – velocidade dos carros – distrib. de freqüência e histograma Distribuição de freqüências (10 classes) e histograma Limite Inferior 60 66 72 78 84 90 96 102 108 114 Limite Superior 66 72 78 84 90 96 102 108 114 120 Ocorrências 1 2 5 7 9 7 10 10 3 6 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 10 Medidas de posição ou tendência central As medidas de posição, também chamadas de percentis, definem um determinado valor dentro do conjunto de dados. As mais comuns são: Máximo Mínimo Quartis Decis As medidas de tendência central definem o centro da distribuição, segundo um determinado critério. As mais comuns são: Média (ou média aritmética) Mediana Moda 11 Medidas de tendência central Média – valor médio dos elementos da amostra Fórmula da média para dados não agrupados (tratados individualmente) Para o exemplo anterior, a média é 93.65 n x1+ x2 + L + xn 1 Média = x = xi = n i =1 n ∑ 12 Medidas de tendência central Fórmula da média para dados agrupados (diagrama de freqüência, onde xi é o valor médio do intervalo i e fi é a freqüência do intervalo i) Para o exemplo anterior, a média é 94,20 n Média = x = ∑ fi xi i =1 n ∑ fi = f1 x1+ f 2 x2 + L + f n xn f1 + f 2 + L + f n i =1 13 Medidas de tendência central Mediana – divide os elementos da amostra em duas partes iguais (o conjunto deve estar ordenado) Se o número de elementos (n) do conjunto for ímpar, a mediana é o elemento de ordem (n+1)/2 Se o número de elementos for par, a mediana é a média entre os elementos de ordem n/2 e (n+2)/2 Para o exemplo anterior, a mediana é (91+91)/2 = 91 Moda – valor que ocorre com maior freqüência Pode haver mais de uma moda Para o exemplo anterior, a moda é 90 (5 ocorrências) Embora a mediana e a moda também possam ser calculadas para dados agrupados, nós não abordaremos esse assunto aqui 14 Medidas de posição Quartis – dividem a amostra em 4 partes iguais (atenção: existem 3 quartis!) Para uma amostra com n elementos, o primeiro quartil (Q1) será o elemento de ordem n/4, o segundo (Q2) o elemento 2n/4 e o terceiro (Q3) o elemento 3n/4 Se as ordens dos elementos referentes aos quartis resultarem em números fracionários, arredonde-os para cima Se as ordens resultarem em números inteiros, tome a média aritmética deste com o seguinte No exemplo anterior, as ordens dos quartis são 15, 30 e 45. Portanto, os quartis são (x15+x16)/2, (x30+x31)/2 e (x45+x46)/2 Os quartis são 83,5, 91 e 104,5 Observe que Q2 é sempre igual à mediana 15 Medidas de posição Máximo – maior valor da amostra Para o exemplo anterior, o máximo é 118 Mínimo – menor valor da amostra Para o exemplo anterior, o mínimo é 63 Decis – semelhante aos quartis, só que dividem a amostra em 10 partes iguais A forma de cálculo é semelhante a dos quartis Embora os quartis e decis (ou qualquer outro percentil) também possam ser calculados para tados agrupados, nós não abordaremos esse assunto aqui 16 Algumas observações sobre as medidas de posição e tendência Como as medidas de posição (mediana, moda, quartis e decis) são calculadas em função da posição relativa dos elementos de uma amostra, elas são insensíveis a valores extremos Essas medidas são chamadas de robustas Ao contrário, a média leva em conta o valor dos elementos de uma amostra, portanto é afetada por valores extremos da amostra 17 Medidas de dispersão Como o próprio nome diz, as medidas de dispersão medem a dispersão ou espalhamento (absoluto ou relativo) dos elementos de uma amostra As principais medidas de dispersão são: Amplitude Variância Desvio-padrão Amplitude interquartílica Coeficiente de variação 18 Medidas de dispersão Amplitude – é a diferença entre os valores máximo e mínimo Para o exemplo anterior, a amplitude é 55 Amplitude interquartílica – é a diferença entre o terceiro e primeiro quartis (Q3 – Q1) Para o exemplo anterior, a amplitude interquartílica é 21 19 Medidas de dispersão Variância – mede o desvio quadrado médio em relação à média dos elementos de uma amostra Fórmula da variância para dados não agrupados Para o exemplo anterior, a variância é 189,18 1 n s = ( xi − x ) 2 n − 1 i =1 2 ∑ ou 1 n 2 2 s = x − nx n − 1 i =1 2 ∑ Atenção: a variância é sempre ≥ 0 !!!!! 20 Medidas de dispersão Fórmula da variância para dados agrupados (xi é o valor médio do intervalo i e fi é a freqüência do intervalo i) Para o exemplo anterior, a variância é 185,76 n 2 s = ∑ i =1 ( xi − x ) 2 f i n ∑ fi i =1 ou s2 = n n i =1 i =1 ∑ xi2 fi − x 2 ∑ fi n ∑ fi i =1 21 Medidas de dispersão Desvio-padrão – é a raiz quadrada da variância Para o exemplo anterior com dados não agrupados, o desviopadrão é 13,75 Para o exemplo anterior com dados agrupados, o desvio-padrão é 13,63 Coeficiente de variação – mede a dispersão dos elementos da amostra em relação à média. Sua fórmula é: CV = s x Para o exemplo anterior com dados não agrupados, o coeficiente de variação é 0,19 22 Interpretando o desvio-padrão O desvio-padrão é expresso na mesma unidade que os valores da amostra, ao contrário da variância, que é expressa em unidades2. Daí, pela definição anterior, segue que o coeficiente de variação é adimensional. Em geral, devemos esperar que valores mais afastados da média (em desvios-padrão) tenham menor chance de ocorrer. Para uma amostra com distribuição simétrica e em formato de sino, encontraremos aproximadamente 68% dos valores estarão no intervalo x ± 1.s 95% dos valores estarão no intervalo x ± 2.s 100% dos valores estarão no intervalo x ± 3.s 23 O desvio-padrão como medida de risco Exemplo – considere dois fundos de investimento, A e B, e seus respectivos retornos nos últimos 12 meses (em %) Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Fundo A 5,25 4,37 5,36 5,64 4,77 4,51 4,82 4,93 5,39 5,29 4,68 5,04 Fundo B 1,23 2,28 3,40 7,00 6,75 7,47 7,28 5,29 10,7 5,37 -0,2 3,45 Em qual dos dois fundos você colocaria o seu dinheiro? 24 O desvio-padrão como medida de risco Para ambos os fundos, R$100 aplicados em janeiro equivaleriam a aproximadamente R$180 em dezembro No entanto o desvio-padrão dos retornos do Fundo A é de 0,39% enquanto que para o Fundo B o desvio-padrão é de 3,10%, ou seja, o padrão de retornos do Fundo A oscilou muito menos em torno da média (foi mais homogêneo) que no Fundo B 25 O desvio-padrão como medida de risco Em Finanças, associamos a dispersão ao risco de um investimento E a teoria financeira diz também que um investidor racional exige retornos mais elevados para assumir riscos maiores Portanto, admitindo que você é um investidor racional, o Fundo A é mais atrativo que o Fundo B, pois para o mesmo retorno esperado em ambos os fundos você corre menos risco no Fundo A! 26 Algumas palavras sobre amostra e população População – conjunto de todos os possíveis elementos pertencentem a uma mesma classe, sujeitos a uma análise, pesquisa etc. População de votantes do Brasil – todos os brasileiros que possuem título de eleitor Um brasileiro que não possua título de eleitor ou um polonês não pertencem à população de votantes do Brasil Amostra – um subconjunto de uma população 27 Algumas palavras sobre amostra e população Até o momento, estamos calculando os parâmetros de amostras O termo n – 1 presente no denominador da fórmula da variância (e do desvio-padrão) é utilizado para torná-lo um estimador não tendencioso Normalmente, os parâmetros de uma amostra (média, desvio-padrão), serão denotados por x e s Para os parâmetros da população, utilizamos µ e σ 28 Utilizando a HP-12C e o Excel® Com a HP-12C, você consegue calcular a média e desvio-padrão para a população e amostra As teclas utilizadas são < x >, <s>, <Σ+> e < Σ-> Exemplo: considere o seguinte conjunto de dados: 4, 2, 5, 9, 3, 6 e 1 A média é 3,57 e o desvio-padrão é 1,99 Vejamos como utilizar a HP-12C 29 Utilizando a HP-12C e o Excel® Tecla Visor Descrição <f><Σ> 0,00 Limpa os registros estatísticos 4<Σ+> 1,00 Primeiro dado inserido 2<Σ+> 2,00 Segundo dado inserido 5<Σ+> 3,00 Terceiro dado inserido 8<Σ+> 4,00 Ops! Dado incorreto 8<g><Σ–> 3,00 Corrijo o dado incorreto 9<Σ+> 4,00 Quarto dado inserido 3<Σ+> 5,00 Quinto dado inserido 6<Σ+> 6,00 Sexto dado inserido 1<Σ+> 7,00 Último dado inserido <g>x 4,29 Média <g>s 2,69 Desvio-padrão da amostra 30 Utilizando a HP-12C e o Excel® O Excel possui diversas funções que permitem o cálculo das estatísticas descritivas Função Descrição maximo(lista) Máximo (maior valor) da lista minimo(lista) Mínimo (menor valor) da lista media(lista) Média (aritmética) dos valores da lista med(lista) Mediana da lista modo(lista) Moda da lista quartil(lista;k) k-ésimo quartil da lista var(lista) Variância amostral da lista (n-1) varp(lista) Variância populacional da lista desvpad(lista) Desvio-padrão amostral da lista desvpadp(lista) Desvio-padrão populacional da lista percentil(lista;k) k-ésimo percentil da lista cont.num(lista) Número de elementos da lista 31 Exemplo – para casa Os dados do gráfico a seguir representam a temperatura máxima na estação Santa Cruz, na cidade do Rio de Janeiro, entre Janeiro de 1982 e Dezembro de 1991. Os dados estão no arquivo stat_case1.xls. Use o Excel para: Calcular a média, mediana, moda, máximo, mínimo, variância, desvio padrão, quartis, percentis 10%, 20%,..., 90% dos dados. Fazer um histograma dos dados. 32 n/ m 82 ai /8 se 2 t/8 ja 2 n/ m 83 ai /8 se 3 t/8 ja 3 n/ m 84 ai /8 se 4 t/8 ja 4 n/ m 85 ai /8 se 5 t/8 ja 5 n/ m 86 ai /8 se 6 t/8 ja 6 n/ m 87 ai /8 se 7 t/8 ja 7 n/ m 88 ai /8 se 8 t/8 ja 8 n/ m 89 ai /8 se 9 t/8 ja 9 n/ m 90 ai /9 se 0 t/9 ja 0 n/ m 91 ai /9 se 1 t/9 1 ja Exemplo – para casa Temperaturas Máximas - 1982 a 1991 37 35 33 31 29 27 25 23 33 Análise Multivariada Até agora, nós estudamos medidas númericas que caracterizam uma única variável por vez Muitas vezes precisamos analisar a relação existente entre duas ou mais variáveis Nós veremos a seguir duas dessas medidas Covariância Coeficiente de correlação 34 Covariância A covariância é uma medida da força da relação linear entre duas variáveis A fórmula da covariância de uma amostra é dada por n ∑ ( xi − x )( yi − y ) s xy = cov xy = i =1 n −1 Observe que para o cálculo da covariância, os valores relativos às duas variáveis devem estar emparelhados 35 Covariância Exemplo: uma grande loja de varejo deseja investigar a relação entre o número de comerciais (x) apresentados na TV e o volume de vendas na semana seguinte ao comercial (y). A tabela abaixo resume os dados Semana # de comerciais Vendas (R$ 000) 65 1 2 50 60 2 5 57 55 3 1 41 4 3 54 5 4 54 45 6 1 38 40 7 5 63 8 3 48 9 4 59 10 2 46 50 35 30 0 2 4 36 6 Covariância Pela análise do gráfico do volume de vendas x e número de comerciais, aparentemente existe uma relação linear forte entre as duas variáveis Calculando a covariância, obtemos: x =3 y = 51 s xy = 11 37 Covariância – interpretação gráfica Observe que a variância é obtida pelo produto dos desvios das variáveis em relação às suas médias Considere o gráfico abaixo Para os quadrantes I e III este produto é positivo, enquano que para os quadrantes II e IV, é negativo 65 x=3 60 II I 55 50 y = 51 45 III 40 IV 35 30 0 2 4 6 38 Covariância – interpretação gráfica Se sxy é positivo, os pontos que exercem maior influência estão localizados nos quadrantes I e III, indicando uma relação linear positiva entre x e y Se sxy é negativo, os pontos que exercem maior influencia estão localizados nos quadrantes II e IV, indicando uma relação linear negativa entre x e y Finalmente, se sxy é nulo ou próximo de zero, os pontos se encontram distribuidos uniformemente ao longo dos 4 quadrantes, não indicando nenhuma relação linear entre x e y 39 Problemas com a covariância Voltando ao exemplo anterior, parece haver uma forte relação linear positiva entre x e y, levando a um valor alto para sxy Mas, o que é um valor alto??? A covariância possui dois grandes problemas: Depende da unidade utilizada nos valores de x e y – se as vendas fossem expressas em R$ (e não R$000), a variância seria 11.000 e não 11 É difícil dizer, a princípio, se sxy é grande ou não – é expressa em uma base absoluta. 40 Coeficiente de correlação Como a covariância, o coeficiente de correlação mede a força da relação linear entre duas variáveis emparelhadas Sua fórmula é dada por: rxy = s xy sx s y Ou seja, o coef. de correlação é apenas a covariância “padronizada” pelos desvios-padrões das duas variáveis (x e y) 41 Coeficiente de correlação Ao contrário da covariância, -1 ≤ rxy ≤ +1, e rxy é ADIMENSIONAL! Quanto mais próximo de +1, mais forte é a relação linear positiva entre x e y Quanto mais próximo de –1, mais forte é a relação linear negativa entre x e y Valores próximos de zero indicam ausência de relação linear entre x e y 42 Coeficiente de correlação No exemplo anterior, temos: s xy = 11 s x = 1,49 s y = 7,93 rxy = s xy sx s y = 11 = 0,93 1,49.7,93 Realmente, as variáveis x e y apresentam uma forte relação linear! Note que A COVARIÂNCIA E O COEFICIENTE DE CORRELAÇÃO MEDEM APENAS A INTENSIDADE DA RELAÇÃO LINEAR ENTRE AS DUAS VARIÁVEIS!!!! 43 Exemplo – Risco de um Portfolio A teoria moderna de Finanças diz que devemos diversificar o nossa carteira de investimento a fim de diminuir o risco. Como já vimos anteriormente, a principal medida de risco utilizada é o desvio-padrão do retorno dos ativos. A partir da tabela a seguir com os retornos mensais de 2 ativos A e B, calcule: (a) a média e o desvio-padrão dos retornos de cada um deles; (b) a média e o desvio-padrão dos retornos de uma carteira composta de 50% do ativo A e 50% do ativo B; (c) idem, com 75% de A e 25% de B. Que conclusões você 44 pode tirar? Exemplo – Risco de um Portfolio Mês Ativo A Ativo B 1 -11,5% 0,6% 2 10,0% 11,9% 3 1,6% -14,5% 4 -9,2% -0,4% 5 1,0% -6,0% 6 -8,9% 7,9% 7 20,4% 17,3% 8 3,0% -10,3% 9 -9,3% -17,8% 10 11,3% 6,5% 11 1,3% -4,6% 12 0,0% -4,4% As fórmulas para o cálculo da média e desvio-padrão de uma carteira são dadas a seguir: x port = wA x A + wB xB 2 s 2port = wA2 s A2 + wB2 s B2 + 2 wA wB s AB wA = peso de A no portfolio wB = peso de B no portfolio 45 Exemplo – Risco de um Portfolio Solução: xA = 0,806%, xB = -1,156%; sA = 9,274%; sB = 10,168% Portfolio A: x = -0,175%; s = 8,459% Portfolio B: x = 0,316%; s = 8,544% Nos dois portfolios, o risco apresentado foi menor do que os riscos dos ativos individuais O retorno médio para ambos os portfolios ficou situado entre os retornos médios dos ativos individuais Conclusão – conseguimos diversificar parte do risco, 46 mas à custa de parte do retorno Análise multivariada – considerações finais Como na seção anterior, as fórmulas para variância e coeficiente de correlação aqui apresentadas referemse a amostras Para a população, as fórmulas são as seguintes: n σ xy = cov xy = ρ xy = ∑ ( xi − µ X )( yi − µY ) i =1 n σ xy σ xσ y 47 Utilizando o Excel® Funções do Excel para análise multivariada Função Descrição covar(x;y) Calcula a covariância populacional entre x e y. Para calcular a covariância amostral, multiplique o resultado obtido por n e divida por n – 1 (n = número de pontos da amostra) correl(x;y) Calcula o coeficiente de correlação populacional entre x e y.Para calcular o coeficiente de correlação amostral, multiplique o resultado obtido por n e divida por n – 1 (onde n é o número de pontos da amostra) 48 Exemplo – para casa O arquivo stat_case2.xls contém as vendas mensais de automóveis (no mercado interno), aparelhos de TV e videocassete no período entre Janeiro de 1995 e Dezembro de 1997. Use o Excel para: Fazer o gráfico da evolução de cada variável ao longo do tempo Fazer o gráfico de dispersão das vendas de cada variável versus cada uma das outras (auto x TV, auto x video, TV x video) Calcular as covariâncias entre todos os pares de variáveis Calcular os coeficientes de correlação entre todos os pares de variáveis 49 Probabilidades – Introdução Probabilidade faz parte do nosso dia a dia, por exemplo: “A previsão da meteorologia é de (grande chance de) chuvas ao final do dia” “O Flamengo possui (MUITAS!!!) chances matemáticas de chegar à final” A probabilidade do candidato XYZ chegar ao 2o. Turno das eleições presidenciais é pequena... A probabilidade da taxa SELIC cair na próxima reunião do COPOM é alta... 50 Probabilidades – Introdução Em resumo: estamos SEMPRE falando sobre probabilidades no nosso dia a dia, resta saber como quantificá-las, e quais os MODELOS mais comuns na prática. Na terminologia usual, a probabilidade reflete a chance de um determinado evento ocorrer Quanto maior a probabilidade, maiores as chances de ocorrência IMPORTANTE: probabilidade é um número entre 0 e 1 sempre! 51 Probabilidades – Introdução E por que é necessário estudar probabilidades? Sempre que lidamos com experiências aleatórias, ou seja, toda vez em que o “mundo” não é determinístico (quase sempre...) Experiência aleatória Aquela cujo resultado não pode ser conhecido antes da realização da mesma, por exemplo: O resultado da jogada de um dado; O número de carros que passam num posto de pedágio num intervalo de meia hora; A cotação do dólar em 02/03/2005; Os números que vão “sair” no concurso da Mega-Sena da próxima semana. 52 Probabilidades – Introdução Mas... note que, embora você não saiba exatamente qual o resultado da experiência aleatória, também não existe ignorância completa sobre o assunto!!! No exemplo do dado, é claro que os resultados possíveis são {1, 2, 3, 4, 5, 6}, as faces do dado; no caso da Mega-Sena, o conjunto de valores possíveis são os 6 números sorteados no conjunto {0, ..., 50} e nos outros exemplos podemos estabelecer um intervalo de valores máximos e mínimos! 53 Probabilidades – algumas definições Experimento ou Experiência Aleatória – atividade objeto do estudo Jogar um dado 5 vezes consecutivas Escolher ao acaso um nome da lista telefônica A cotação do dólar em 02/03/2002 54 Probabilidades – algumas definições Espaço Amostral ou Universo – conjunto de todos os possíveis resultados que podem ocorrer em um experimento Todas as possíveis combinações de 5 arremessos consecutivos de um dado (7.776) Total de nomes da lista telefônica do Rio de Janeiro (???) Valores entre R$ 1.50 e 150 reais (cotação do dólar em 02/03/2005) Evento – um conjunto de possíveis resultados de um experimento Seqüências de 5 valores diferentes Nomes que comecem com P e tenham 5 letras Cotação do dólar entre 3.8 e 8.5 reais em 02/03/2005 55 Probabilidades – algumas definições Complemento de um evento A ou Ac – todos os elementos do espaço amostral que não pertencem a A Se a probabilidade de um evento A for p (decimal), a probabilidade de Ac será 1 – p Eventos mutuamente exclusivos A e B – os elementos de A não pertencem a B e vice-versa A ocorrência do evento A implica na não ocorrência do evento B e vice-versa Eventos coletivamente exaustivos A e B – a união dos elementos de A e B formam o espaço amostral 56 Probabilidades – métodos de cálculo Existem dois métodos quantitativos para a determinação de probabilidades de ocorrência de eventos. O primeiro, chamado de Método Clássico, assume que todos os elementos do espaço amostral são equiprováveis e a probabilidade de ocorrência de um determinado evento A, P(A), é definida como o número de resultados favoráveis (pertencentes ao evento), N(A), dividido pelo número total de resultados possíveis (espaço amostral), N(U). N ( A) P ( A) = N (U ) 57 Probabilidades – métodos de cálculo Exemplo: Considere o lançamento de dois dados não viciados. Qual é a probabilidade da soma dos valores obtidos ser 5? Solução: O espaço amostral contém 36 elementos (6 possibilidades para o primeiro dado e 6 possibilidades para o segundo dado) O evento considerado possui 4 elementos – os pares (1,4), (4,1), (2,3) e (3,2) A probabilidade de A, P(A), é dada por: P ( A) = N ( A) 4 = = 0,11 N (U ) 36 58 Probabilidades – métodos de cálculo No segundo método, chamado de Método da Freqüência Relativa, não podemos assumir que todos os elementos do espaço amostral são equiprováveis Desta forma, devemos obter alguma amostra representativa do espaço amostral e utilizar a proporção de elementos favoráveis da amostra em relação ao tamanho total da amostra como estimativa da probabilidade do evento A As conclusões obtidas por esse método somente serão válidas se as amostras utilizadas mantiverem as mesmas características e condições da população (espaço amostral) 59 Probabilidades – definição freqüência relativa Seja E uma experiência aleatória, e supomos que a experiência pode ser repetida n vezes, sempre nas mesmas condições. Sejam A e B eventos quaisquer, e na e nb representam o número de ocorrências dos eventos A e B nas n repetições da experiência E. Por exemplo, suponha que E é a experiência: jogar um dado e observar o número que saiu. Seja A o evento: saiu um número par, e B o evento: saiu o número 6. Joga-se o dado 20 vezes, e observa-se as seguintes freqüências para cada face do dado: 60 Probabilidades – definição freqüência relativa face do dado freqüência 1 4 2 4 3 3 4 5 5 2 6 2 Então : na = 11 e nb = 2, e n = 20 (número de repetições da experiência). Intuitivamente, se tivéssemos jogado o dado um número bem maior de vezes, nós nos sentiríamos mais confiantes em afirmar que a probabilidade de uma das faces do dado seria igual ao número de vezes em que aquela face "saiu" dividido pelo número de repetições da experiência. 61 Probabilidades – definição freqüência relativa Definição - Freqüência relativa A freqüência relativa de um evento A, denotada por fA é definida por: fA = na / n onde na indica o número de ocorrências do evento A dentre as n repetições da experiência. A partir da definição vemos que as freqüências relativas dos eventos A e B são, respectivamente, 11/20 = 0.55 e 2/20 =0.10 . 62 Probabilidades – métodos de cálculo Exemplo: De um total de 5.000 nascimentos, 394 foram de gêmeos, trigêmeos ou mais. Qual a probabilidade de ocorrer o nascimento de uma única criança (não gêmeo)? Solução: A amostra é composta por 5.000 elementos O evento considerado possui 5.000 – 394 = 4.606 elementos A probabilidade de A, P(A), é dada por: N ( A) 4606 = = 0,9212 P ( A) = N (U ) 5000 63 Probabilidades – algumas definições Espaço amostral e eventos – representação gráfica (Diagrama de Venn) Espaço Amostral Evento A Interseção entre os eventos A e B Evento B 64 Probabilidades – algumas definições Eventos complementares – o complemento de A (Ac) é composto por todos os elementos do espaço amostral que não pertencem a A Espaço Amostral Ac A 65 Probabilidades – algumas definições Eventos mutuamente exclusivos – os elementos de A não pertencem a B e vice-versa Obseve que dois eventos complementares são mutuamente exclusivos Espaço Amostral A B 66 Probabilidades – algumas definições Eventos coletivamente exaustivos – a união de todos os elementos pertencentes a esses eventos forma o espaço amostral Eventos coletivamente exaustivos podem ser mutuamente exclusivos (quando não há interseção entre eles) ou não Espaço Amostral A B C 67 Leis da Adição As leis da adição são úteis quando quando temos dois ou mais eventos e desejamos calcular a probabilidade de que pelo menos um deles ocorra Antes, vamos discutir dois conceitos importantes: a união e a interseção de eventos A união de dois eventos A e B é um evento C composto por todos os elementos pertencentes a A, B ou ambos, denotada por A ∪ B A interseção de dois eventos A e B é um evento C composto por todos os elementos pertencentes simultaneamente a A e B, denotada por A ∩ B 68 Leis da adição – caso geral P(A+B) = P(A ou B) = P(A ∪ B) = P(A) + P(B) – P(A ∩ B) A razão do último termo da fórmula e que quando somamos P(A) e P(B) estamos contando duas vezes P(A ∩ B) A∩B Espaço Amostral A B 69 Leis da Adição – casos particulares Eventos mutuamente exclusivos P(A+B) = p(A) + p(B), já que P(A ∩ B) = 0 Eventos complementares P(A+B) = P(A) + P(B) = 1, já que P(A ∩ B) = 0 Eventos coletivamente exaustivos P(A+B) = P(A) + P(B) – P(A ∩ B) = 1 Eventos coletivamente exaustivos e mutuamente exclusivos P(A+B) = P(A) + P(B) = 1, já que P(A ∩ B) = 0 70 Leis da Adição - exemplo Um banco possui 10 fundos de investimento. Desses, 6 são de renda fixa, 4 são corporativos e 2 são de renda fixa e corporativos. Se escolhermos um fundo ao acaso, qual é a probabilidade dele ser de renda fixa ou corporativo? Solução (evento A: renda fixa evento B: corporativo) Universo = 10 elementos P(A+B) = P(A) + P(B) – P(A ∩ B) P(A) = 6/10 = 0,6 P(B) = 4/10 = 0,4 P(A ∩ B) = 2/10 = 0,2 P(A U B) = 0,6 + 0,4 – 0,2 = 0,8 ou 80% 71 Exemplo - para casa Uma empresa de TV a cabo possui 10000 clientes. Destes, 3500 assinam o pacote de programação premium, e 6000 possuem mais de um “ponto” instalado em casa. 2000 clientes são, simultaneamente, assinantes premium com mais de um “ponto” instalado. Escolhe-se um cliente ao acaso. Qual a probabilidade dele ser assinante premium ou ter mais de um “ponto” instalado em casa? 72 Leis da Multiplicação Eventos independentes – a ocorrência de A não influencia B e vice-versa Dois arremessos consecutivos de uma moeda As idades das próximas duas pessoas a entrar em um banco Probabilidade de ocorrência de dois eventos independentes P(A x B) = P(A e B) = P(A ∩ B) = P(A) x P(B) Exemplo: qual a probabilidade de ocorrência de exatamente 3 caras em três arremessos consecutivos de uma moeda? P(cara) = 0,5 P(3 caras) = 0,5 x 0,5 x 0,5 = 0,125 73 Leis da Multiplicação Exemplo: qual a probabilidade de ocorrência de pelo menos uma cara em três arremessos consecutivos de uma moeda? Método A: (c – cara o – coroa) 1o 2o 3o c c c c c o c o c c o o o c c o c o o o c o o o Universo: 8 Elementos favoráveis: 7 P(A): 7/8 = 0,875 74 Leis da Multiplicação Método B: Observe que o evento A: “obter pelo menos 1 cara” é complementar ao evento B:“não obter nenhuma cara” Conseqüentemente P(A) + P(B) = 1 P(B) = 0,5 x 0,5 x 0,5 = 0,125 Logo, P(B) = 1 – P(A) = 0,875 75 Independência e Dependência Exemplo Tomou-se uma amostra com 1000 pessoas num shopping-center com o objetivo de investigar a relação entre renda familiar e posse de cartões de crédito. A partir dos dados da próxima tabela pergunta-se: existe independência entre “renda” e “número de cartões”? 76 Independência e Dependência Renda Familiar Núm. Cartões 0 1 2 ou mais < R$ 500 R$ 501 a R$1000 R$ 1001 a R$ 2000 > R$ 2001 260 50 20 170 100 25 80 110 45 20 60 60 530 320 150 330 295 235 140 1000 Se existe independência entre as duas variáveis, então Pr(Ai ∩Bj) = Pr(Ai).Pr(Bj) para todos i e j, onde Ai indica o nível de renda e Bj o número de cartões de crédito. Logo, basta provar que a igualdade acima não é válida para ALGUMA célula na tabela para concluir que as duas variáveis são dependentes. Se olharmos para a célula superior esquerda vemos que: 77 Independência e Dependência Pr(renda abaixo de R$ 500 E 0 cartões) = 0.26 Mas: Pr(renda abaixo de R$ 500) = 330/1000 = 0.33 Pr( 0 cartões de crédito) = 530/1000 = 0.53 E como 0.26 ≠(0.33)(0.53), segue que as variáveis “renda familiar” e “número de cartões de crédito” são dependentes. 78 Probabilidade Condicional Probabilidade condicional – probabilidade de ocorrência de um evento A dado que o evento B ocorreu Escrevemos P(A | B) Para eventos independentes, P(A | B) = P(A) x P(B) Exemplo: qual a probabilidade de ocorrência de uma cara em um segundo arremesso de uma moeda, dado que o primeiro arremesso deu cara? 79 Probabilidade Condicional Para eventos dependentes, P(A | B) = P(A ∩ B)/P(B) desde que P(B) seja diferente de zero. Exemplo: em uma amostra de 100 funcionários de uma empresa, 35 são homens e fumantes, 28 são homens e não fumantes, 17 são mulheres fumantes e 20 são mulheres e não fumantes. Qual a probabilidade de um funcionário escolhido ao acaso ser fumante, dado que ele é homem? 80 Probabilidade Condicional Fumantes Mulheres Fumantes Homens Não fumantes Total Homens 35 28 63 Mulheres 17 20 37 Total 52 48 100 Não fumantes 81 Probabilidade Condicional Observe que quando definimos que o evento B ocorreu (o funcionário é homem), restringimos o universo para a ocorrência do evento A (o funcionário é fumante) O novo universo passa a ser o próprio evento B Fumantes Mulheres Homens Não fumantes Fumant es Não fumantes Homens 35 28 63 Mulheres 17 20 37 Total 52 48 100 Total Novo universo P(A ∩ B) 82 Probabilidade Condicional Utilizando o número de elementos de cada evento, temos: P(A | B) = 35/63 = 0,556 Ou utilizando as probabilidades: P(B) = 63/100 = 0,63 P(A ∩ B) = 35/100 = 0,35 P(A | B) = P(A ∩ B)/P(B) = 0,35/0,63 = 0,556 83 Exemplo - para casa Um grupo de 100 pessoas inclui 40 com diploma de curso superior, 20 microempresários e 10 que são, ao mesmo tempo, portadores de diploma do curso superior e microempresários. Calcule a probabilidade de alguém ser microempresário sabendo que ele tem diploma de curso superior. 84 Distribuições de probabilidade – algumas definições Variável aleatória – é aquela cujo valor pode assumir qualquer um dos possíveis resultados de um experimento Variáveis aleatórias discretas – são aquelas que podem assumir apenas valores definidos, por exemplo, número inteiros ou inteiros positivos. Exemplos: número de expectadores em uma sessão de cinema, resultado do lançamento de um dado, número de pessoas numa fila de banco, número de assaltos numa esquina. 85 Distribuições de probabilidade – algumas definições Variáveis aleatórias contínuas – são aquelas que podem assumir quaisquer valores dentro de um intervalo. Exemplo: tempo de atendimento em um caixa de banco, peso real de um pacote de 1 Kg de açúcar, custo de construção de uma fábrica, custo de lançamento de uma campanha publicitária de um novo produto. Distribuição discreta de probabilidade ou função de probabilidade – função que associa a cada possível valor de uma variável aleatória discreta a sua probabilidade de ocorrência 86 Distribuições discretas de probabilidade - exemplo Considere a variável aleatória discreta x que representa o número de caras em quatro lançamentos de uma moeda. Determine a sua distribuição de probabilidades Tabela de Ocorrências 1 c c c c c c c c 2 c c c c o o o o 3 c c o o c c o o 4 c o c o c o c o x 4 3 3 2 3 2 2 1 1 o o o o o o o o 2 c c c c o o o o 3 c c o o c c o o 4 c o c o c o c o Distribuição de Probabilidades x 3 2 2 1 2 1 1 0 x Freq. Prob. 0 1 0,0 6 1 4 0,2 5 2 6 0,3 8 3 4 0,2 5 4 1 0,0 6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 87 Distribuições de probabilidade – mais definições Para qualquer distribuição discreta de probabilidades, duas condições devem ser satisfeitas: 0 < pi ≤ 1 Σpi = 1 Valor esperado, média ou esperança matemática E(X) ou µ - de uma distribuição discreta de probabilidades – é o valor médio obtido para a variável aleatória se o experimento fosse repetido um número infinito de vezes Normalmente esse valor é obtido analiticamente ou através de um número grande de observações Variância de uma distribuição de probabilidades (σ2) – mede a dispersão dos valores da distribuição 88 Distribuições de probabilidade – mais definições Desvio-padrão de uma distribuição de probabilidades (σ) – também mede a dispersão dos valores da distribuição. É igual à raiz quadrada da variância. Fórmulas (a seguir pi indica a prob. do valor xi) n µ = ∑ xi . pi i =1 n σ = ∑ ( xi − µ ) 2 pi 2 i =1 σ= n ∑ (x − µ) i =1 i 2 pi 89 Distribuições de probabilidade – mais definições Função de distribuição ou Função de Distribuição Acumulada (F(x0)) Para cada valor x0 da variável aleatória, é a probabilidade de estar naquele valor, ou abaixo dele, isto é: F(x0) = Pr( X ≤ x0) para todo x0 Note que, como F(x0) é uma probabilidade, ela está limitada ao intervalo (0,1). Algumas funções de distribuição são tabeladas, por exemplo, a da distribuição Normal (0,1). O Excel normalmente fornece a opção de calcular a função de probabilidade (ou a densidade) ou a função de distribuição acumulada, através de um argumento lógico nas suas diversas funções estatísticas – por exemplo, vide o help da função dist.binom 90 Distribuição Uniforme Discreta Cada ocorrência da variável X tem igual probabilidade de acontecer Logo, cada ocorrência tem probabilidade 1/n onde n é o número de possíveis ocorrências de X Exemplo: x = valor obtido no lançamento de um dado não viciado Distribuição Uniforme x Freq. Prob. 0.20 1 1 0,167 0.15 2 1 0,167 3 1 0,167 4 1 0,167 0.05 5 1 0,167 0.00 6 1 0,167 0.10 1 2 3 4 5 6 91 Distribuição Binomial A distribuição binomial está associada a experimentos binomiais, que têm as seguintes características: Consistem de n tentativas (repetições) idênticas Em cada tentativa, existem apenas dois resultados possíveis, que são chamados genericamente de sucesso e fracasso A probabilidade de um sucesso, representada por p, é constante ao longo das n tentativas Conseqüentemente, a probabilidade de um fracasso, 1 – p, também é constante ao longo das n tentativas As tentativas são independentes, ou seja, o resultado de uma tentativa não influencia os resultados das demais 92 Distribuição Binomial A variável aleatória de interesse corresponde ao número de sucessos de um experimento, por exemplo: Número de caras em 4 lançamentos consecutivos de uma moeda Número de “6” em dois lançamentos consecutivos de um dado Número de questões “chutadas” corretamente numa prova de múltipla escolha com 10 questões, em que cada questão tem 5 alternativas (imagine que a prova é em Chinês, e aí você realmente tem a mesma probabilidade de acerto em cada questão... Desde que você não saiba falar Chinês, é claro....) 93 Distribuição Binomial O número de tentativas em um experimento (com n tentativas) que proporcionam exatamente x sucessos é dado por n n! , onde x!= x.( x − 1).( x − 2)L 2.1 = x x!( n − x)! Exemplo: considere 4 arremessos de uma bola de basquete ao cesto. O número de tentativas com 2 bolas certas (sucesso) é dado por: 4 4! 4.3.2.1 24 = = =6 = 2 2!(4 − 2)! 2.1.(2.1) 4 94 Distribuição Binomial Dado um experimento binomial com n repetições, a probabilidade de encontrar exatamente x sucessos (com probabilidade p para cada sucesso) é: n x n! n− x f ( x) = p (1 − p ) = p x (1 − p ) n− x x!(n − x)! x Exemplo: em uma loja, a probabilidade de um cliente realizar uma compra é de 15%. Qual a probabilidade de, entre 5 clientes que entram na loja, exatamente 3 realizarem uma compra? n = 5; x = 3; p = 0,15 f (3) = 5! 0,153.0,852 = 0,024 3!.2! 95 Distribuição Binomial Exemplo: considere 10 lançamentos consecutivos de um dado não viciado. Qual a probabilidade de obtermos exatamente 5 vezes o número 2? Embora o lançamento de um dado tenha 6 possíveis resultados, podemos utilizar a distribuição binomial da seguinte forma: Sucesso: obter o número 2 Fracasso: não obter o número 2 (obter 1, 3, 4, 5 ou 6) n = 10; x = 5; p = f (3) = 1 = 0,167 6 10! 0,167 5.0,8335 = 0,013 5!.5! 96 Distribuição Binomial A média para a distribuição Binomial é: E ( x ) = µ = np E a variância: σ 2 = np (1 − p ) No exemplo anterior temos: – Valor esperado: 6.0,167 = 1 – Variância: 6.0,167.(1 – 0,167) = 0,833 97 Distribuição Binomial Exemplo No jogo de roleta existem 37 resultados possíveis em cada rodada (0 a 36). Calcule a probabilidade de obtermos pelo menos 3 ocorrências do número 16 em 30 tentativas (experimento A). Calcule também o valor esperado da variável e a sua variância. Solução Podemos considerar um experimento binomial com sucesso = {ocorrência do número 16} e fracasso = {não ocorrência do número 16} 98 Distribuição Binomial Solução (cont.) Obtermos pelo menos 3 sucessos = obtermos 3, 4, 5, ..., 29 ou 30 sucessos – dá muito trabalho para calcular! Porém, se considerarmos o experimento B: obtermos 0, 1 ou 2 sucessos vemos que ele é complementar ao experimento original. Logo Prob(A) + Prob(B) = 1 ou Prob(A) = 1 – Prob(B) Para o experimento B, temos n = 30, x = 0, 1 ou 2 e p = 1/37 = 0,027 Calculando, obtemos Prob(B) = f(0) + f(1) + f(2) = 0,44 + 0,37 + 0,15 = 0,96 99 Distribuição Binomial Solução (cont.) Então, Prob(A) = 1 – Prob(B) = 1 – 0,96 = 0,04 O valor esperado é n.p = 30.(1/37)= 0,811 A variância é n.p.(1-p)= 30(1/37).(36/37)= 0,788 100 Distribuição Binomial Exemplo Numa eleição supõe-se que 30% dos eleitores são favoráveis a uma certa proposta. Toma-se uma amostra de tamanho 20 de eleitores da cidade do Rio de Janeiro. Calcular as probabilidades de 4, 5, 6, 7, 8, 9 ou 10 dos eleitores na amostra serem favoráveis à proposta. Solução Seja X o número de eleitores na amostra que são a favor da proposta. Então os valores possíveis de X são 0, 1, 2, ...., 20, e X tem distribuição Binomial com parâmetros n = 20 e p = 0.30. 101 Distribuição Binomial As probabilidades para os diversos valores de X são calculadas através da fórmula: 20 20! Pr( X = x) = .(0.30) x .(0.70) 20− x = .(0.30) x .(0.70) 20− x x!(20 − x)! x A tabela a seguir foi produzida usando a função dist.binom do Excel para x = 4, 5, ..., 10. x 4 5 6 7 8 9 10 Pr(X =x) 13.04% 17.89% 19.16% 16.43% 11.44% 6.50% 3.08% 102 Distribuição Binomial – Quadro Resumo - Exemplos experiência aleatória "sucesso" acertar a "chutar" a resposta resposta numa prova de da questão múltipla escolha onde cada questão tem 5 opções nascimento de menina uma criança numa família jogada de um sair o número dado 6 verificar se uma peça produzida numa fábrica tem defeito peça tem defeito "falha" errar a resposta p= probabilida de de "sucesso" 1/5 menino 1/2 sair qualquer outro número 1/6 peça não tem defeito proporção de peças com defeito na população de peças n = número de repetições da experiência X = variável aleatória Binomial número de questões da prova número de respostas certas na prova número de crianças na família número de jogadas do dado tamanho da amostra número de meninas na família número de vezes em que saiu o número 6 nas n jogadas do dado número de peças com defeito na amostra 103 Exemplo (para casa – use o Excel) Um exame vestibular consiste em 100 questões de múltipla escolha, cada uma com 5 respostas possíveis. Em cada questão, apenas uma resposta é correta. a) Qual a probabilidade de que uma pessoa que “chute” todas as questões acerte 35 ou mais questões? b) Qual a probabilidade desta pessoa acertar entre 17 e 25 (incluindo 17 e 25) questões? c) Qual o número esperado de questões certas para uma pessoa que “chute” todas as questões? 104 Exemplo (para casa – use o Excel) Uma empresa aérea sabe que 20% das pessoas que fazem reservas aéreas cancelam suas reservas. A empresa vende 50 passagens para um vôo que contém apenas 46 lugares. Supondo que as pessoas cancelam suas reservas de maneira independente, calcule a probabilidade de que haverá assentos para todos os passageiros. 105 Exemplo (para casa – use o Excel) Você arranjou um emprego numa pizzaria que funciona no sistema de entrega a domicílio. Apenas 5% dos pedidos são de pizza de lombinho com abacaxi. Você recebe exatamente 9 pedidos pelo telefone, qual a probabilidade de, no máximo, 1 pizza de lombinho com abacaxi ser pedida? Você recebe exatamente 30 pedidos pelo telefone num dia de bastante movimento, qual a probabilidade de receber mais de 3 pedidos de pizza de lombinho com abacaxi? Dica: pare e pense antes de fazer contas desnecessárias!!!!!! 106 Distribuição de Poisson A distribuição de Poisson está associada a experimentos de Poisson, que geralmente modelam o número de ocorrências de um evento dentro de um determinado intervalo de tempo (ou espaço), por exemplo: Número de carros que passam por uma estrada no intervalo de uma hora Número de buracos por km de uma rodovia Número de assassinatos num final de semana Um experimento de Poisson possui as seguintes características A probabilidade de uma ocorrência é a mesma para intervalos iguais As ocorrências são independentes 107 Distribuição de Poisson Dado um experimento de Poisson com média de ocorrências por intervalo igual a µ, a probabilidade de obtenção de exatamente x ocorrências é dada por f ( x) = Pr( X = x) = µ xe− µ x! Exemplo: o número médio de clientes que entram em um banco num período de 15 minutos é 10. Qual a probabilidade de entrarem extamente 5 clientes em 15 minutos? µ = 10; x = 5 105 e −10 = 0,0378 f (5) = 5! 108 Distribuição de Poisson Exemplo Em uma fábrica de cabos elétricos, o número médio de defeitos por quilômetro de cabo é 4. (a) Qual a probabilidade de encontrarmos exatamente 15 defeitos em 5 quilômetros de cabo? (b) E qual a probabilidade de encontrarmos mais do que 20 defeitos por 5 quilômetros de cabo? 109 Distribuição de Poisson Solução Observe que a média de defeitos é dada por quilômetro e o item (a) se refere ao número de defeitos em 5 quilômetros Podemos assumir que o processo de fabricação é uniforme, logo o número médio de defeitos independe de qual quilômetro de cabo estamos nos referindo e a ocorrência de um defeito não interfere na ocorrência dos demais defeitos – condições necessárias para um experimento de Poisson Como a probabilidade de ocorrência de um defeito é a mesma, independente do km de cabo observado, a média de defeitos em 5 km de cabo = 5 x média de defeitos por km Então, µ = 5 x 4 = 20 defeitos e x = 15 defeitos 2015 e −20 f ( 4) = = 0,052 15! 110 Distribuição de Poisson Solução (cont.) p(x ≥ 20) = 1 – p(0) + p(1) + ... + p(18) + p(19) ´ muito trabalho! Uma solução mais prática é utilizarmos a distribuição de Poisson acumulada (veremos logo a seguir a função do Excel correspondente) A função acumulada nos dá a soma das probabilidades desde 0 até x p(x ≥ 20) = 1 – pacum(19) = 1 – 0,47 – 0,53 111 Distribuição de Poisson Exemplo Numa campanha de caridade feita por um programa de TV em todo o Brasil, o número de pessoas que contribuem mais de 500 reais é uma variável aleatória com média de 5 pessoas por programa. a) Calcule a probabilidade de que, num certo programa, o número de pessoas que contribuem mais de 500 reais exceda 8. b) Faça o gráfico da função de probabilidade. c) Faça um gráfico da função de distribuição acumulada. 112 Distribuição de Poisson Solução Seja X o número de pessoas que contribuem com mais de 500 reais a cada programa. Desejamos calcular Pr{ X > 8}. Pr{ X > 8} = 1 - Pr{ X ≤ 8} = 1 - F(8) onde F(.) denota a função de distribuição acumulada. A tabela a seguir apresenta a função de probabilidade, a função de distribuição acumulada e seu complemento. Da tabela segue que Pr( X > 8 ) = 6.81%. 113 Distribuição de Poisson x Pr(X = x) Pr( X <= x) 1- F(x) = Pr(X > x) 0 0.67% 0.67% 99.33% 1 3.37% 4.04% 95.96% 2 8.42% 12.47% 87.53% 3 14.04% 26.50% 73.50% 4 17.55% 44.05% 55.95% 5 17.55% 61.60% 38.40% 6 14.62% 76.22% 23.78% 7 10.44% 86.66% 13.34% 8 6.53% 93.19% 6.81% 9 3.63% 96.82% 3.18% 10 1.81% 98.63% 1.37% 11 0.82% 99.45% 0.55% 12 0.34% 99.80% 0.20% 114 Distribuição de Poisson b) A função de probabilidade é dada no gráfico abaixo Função de Probabilidade Poisson(5) 20% 15% 10% Pr(X = x) 5% 12 10 8 6 4 2 0 0% 115 Distribuição de Poisson c) A função de distribuição acumulada é mostrada a seguir. Função de Distribuição Acumulada - Poisson(5) 100% 80% 60% Pr( X <= x) 40% 20% 12 11 10 9 8 7 6 5 4 3 2 1 0 0% 116 Exemplo (para casa – use o Excel) O número de enchentes em cada verão no Rio de Janeiro é uma variável aleatória Poisson com média de 2 enchentes por verão. Calcule a probabilidade de ocorrerem exatamente 3 enchentes em um verão qualquer. Calcule a probabilidade de ocorrerem menos de 10 enchentes em 30 verões. 117 Exemplo (para casa – use o Excel) O número de carros que chegam num posto de pedágio é uma variável Poisson com média de 3 carros por minuto. Use o Excel para calcular: A probabilidade de passarem mais de 4 carros num minuto. A probabilidade de passarem menos de 25 carros em 10 minutos. 118 Utilizando o Excel® Funções do Excel para distribuições discretas de probabilidades Função Descrição dist.binom(s;n;p;a) Utilizando a distribuição binomial, calcula a probabilidade de s sucessos em n tentativas, com probabilidade de sucesso p. Se a = VERDADEIRO, retorna a probabilidade acumulada (de 0 a s sucessos) poisson(x;µ;a) Utilizando a distribuição de Poisson, calcula a probabilidade de x ocorrências para um número médio de ocorrências µ. Se a = VERDADEIRO, retorna a probabilidade acumulada (de 0 a x ocorrências) 119 Distribuições contínuas de probabilidades Como já foi dito antes, variáveis aleatórias contínuas são aquelas que podem assumir quaisquer valores dentro de um intervalo Para variáveis aleatórias discretas, nós podiamos atribuir uma probabilidade a uma determinada ocorrência da variável Para variáveis aleatórias continuas a situação é bem diferente Como uma variável contínua assumir qualquer valor em um intervalo, na realidade ela pode assumir infinitos valores 120 Distribuições contínuas de probabilidades Portanto, não podemos falar da probabilidade de ocorrência de um valor em particular Ao invés disso, devemos pensar na probabilidade de ocorrência associada a um intervalo Na discussão anterior sobre distribuições discretas de probabilidades introduzimos o conceito de função de probabilidade – f(x) No caso contínuo, nós utilizaremos a função densidade de probabilidade, também representada por f(x) 121 Distribuições contínuas de probabilidades Nesse caso, a função densidade de probabilidade fornece um valor para cada possível valor (infinitos) da variável x No entanto, os valores de f(x) não representam as probabilidades associadas a x Ao invés disso, a área (isto é, a integral!) sob a função de densidade de probabilidade em um determinado intervalo de x fornece a probabilidade de ocorrência de um valor dentro desse intervalo 122 Distribuições contínuas de probabilidades Analogamente ao caso discreto, uma função de densidade de probabilidade contínua deve obedecer à seguinte condição de +“normalização”: ∞ ∫ f ( x)dx = 1 −∞ Valor esperado ou esperança matemática - E(x) ou µ - de uma distribuição contínua de probabilidades – é o valor médio obtido para a variável aleatória se o experimento fosse repetido um número infinito de vezes – Normalmente esse valor é obtido analiticamente ou através de um número grande de observações Variância de uma distribuição de probabilidades (σ2) – mede a dispersão dos valores da distribuição 123 Distribuições contínuas de probabilidade - exemplo Considere a seguinte função de densidade de probabilidade: f(x) = (x + 1)/4 para 0≤ x ≤ 2. (a) Verifique se esta é uma função de densidade de probabilidade válida para o intervalo considerado. (b) Calcule a probabilidade de x ≥ 1 f(x) (x + 1)/4 3/4 1/4 0 2 x 124 Distribuições contínuas de probabilidade - exemplo Solução: (a) Para que f(x) seja uma função de densidade de probabilidade válida, devemos ter a sua área = 1 para todos os intervalos de validade de x Neste caso, devemos calcular a área sob a função no intervalo de 0 a 2 A área dessa região é dada por f ( 2) + f (0) 3 / 4 + 1/ 4 Área = 2 =1 (2 − 0) = 2 2 Logo, f(x) representa probabilidade válida uma função de densidade 125 de Distribuições contínuas de probabilidade - exemplo Solução: (b) A probabilidade para um determinado intervalo de x é dada pela área sob a função de densidade de probabilidade nesse intervalo P(x ≥ 1) corresponde à área sob a função para 1 ≤ x ≤ 2 3/ 4 + 2 / 4 f (2) + f (1) Área = (2 − 1) = 1 = 0,625 2 2 126 Distribuição Uniforme A probabilidade de ocorrência em dois intervalos quaisquer de mesmo tamanho é a mesma – a função de densidade de probabilidade é uma reta paralela ao eixo horizontal. Se considerarmos os limites de ocorrência de x como sendo a e b (a ≤ b) devemos ter necessáriamente f(x) = 1/(b – a) para que a probabilidade total seja 1 Exemplo: um vôo da ponte aérea RJ-SP leva entre 40 e 50 minutos, com igual probabilidade de ocorrência dentro desse intervalo A distribuição é uniforme f(x) = 1/(50 – 40) f(x) 0,1 0 40 50 x 127 Distribuição Uniforme Exemplo: O peso mínimo de um pacote de 1Kg de café é de 0,98Kg. O fabricante garante que a distribuição de pesos é uniforme e que a função de densidade de probabilidade, f(x), é igual a 9,75. Se o fabricante disse a verdade, qual é o peso máximo que um pacote de café pode ter? Solução: Chamemos o peso máximo de b Se a distribuição é uniforme, a área sob f(x) no intervalo de validade de x deve ser igual a 1 A área é dada por f(x).(b – a), onde f(x) = 9,75 e a = 0,98 Logo, b = a + 1/f(x) = 0,98 + 1/9,75 = 1,0826 128 Distribuição Uniforme O valor esperado para a distribuição contínua Uniforme é: E( X ) = µ = ( a + b) 2 E a variância: 2 ( ) b − a σ2 = 12 No exemplo anterior temos: – Valor esperado: 1,0313 – Variância: 0,00088 129 Distribuição Uniforme Exemplo (para casa) O retorno de uma aplicação financeira de risco num intervalo de uma semana é uma variável com distribuição Uniforme no intervalo –2% a 1.8%. Calcule: a) A probabilidade do retorno do investimento nesta semana ser positivo. b) A probabilidade do retorno estar entre –1% e +1%. c) A probabilidade do retorno exceder 0.5%. d) Qual o retorno médio esperado numa semana qualquer? E o risco associado a este investimento? 130 A distribuição Normal É a mais importante distribuição contínua É utilizada para descrever inúmeras aplicações práticas Altura e peso de pessoas Nível de chuvas Altura de árvores em uma floresta A função de densidade de probabilidade é simétrica em torno da média e possui a forma de um sino. f(x) é dada por 1 f ( x) = σ 2π − ( x −µ ) 2 2 2 σ e µ indica a média da distribuição e σ2 a sua variância 131 A distribuição Normal A distribuição normal é totalmente caracterizada por sua média µ e seu desvio-padrão σ A média define o deslocamento horizontal da curva, enquanto que o desvio-padrão define o seu achatamento 0.30 µ=10 µ=12 0.30 0.25 0.25 0.20 0.20 0.15 0.15 0.10 0.10 0.05 0.05 0.00 0.00 5 10 15 σ =1,5 σ =2,5 2 7 12 17 132 A distribuição Normal Normal com média µ e variância σ2 Densidade ( f x, µ ,σ 2 )= 1 2πσ 2 − ( x − µ )2 exp 2 2 σ Função de Distribuição: Pr( X ≤ x) F ( u ) = Pr ( X ≤ u ) = 1 2 πσ 2 − ( x − µ ) 2 ∫− ∞exp 2σ 2 dx u Não é possível resolver analiticamente esta integral - precisamos de uma tabela! Tabela: distribuição N(0,1) 133 A distribuição Normal Problema: Não é possível criar uma tabela para cada uma das (infinitas) densidades Normais existentes. Solução: Trabalha-se com a densidade Normal com média 0 e variância 1, e converte-se todas as outras Normais para esta, chamada de Normal padrão ou Normal standard. A maioria dos livros de estatística fornece tabelas de probabilidade para a distribuição normal padronizada A distribuição normal padronizada possui média 0 e desviopadrão 1 134 A distribuição Normal Se X pertence a uma distribuição normal com média µ e desvio-padrão σ, seu valor normalizado é dado por: X −µ Z= σ Existem dois tipos de tabela, que fornecem basicamente a mesma coisa: 1) Pr(0≤ Z ≤ z0), ou seja, a probabilidade do lado direito da curva normal a partir da média até o valor z0 2) Φ(z0) = Pr ( Z ≤ z0) = 0.5 + Pr (0≤ Z ≤ z0) (por que?) 135 A Distribuição Normal Toda variável Normal pode ser transformada numa Normal com média 0 e variância 1. Logo, só existe a necessidade de criar uma única tabela para a função de distribuição acumulada. Se X é N( µ , σ2 ) . Então a variável Z = ( X - µ ) /σ tem distribuição Normal com média zero e variância um, isto é, Z é N(0,1). 136 A Distribuição Normal Cálculo de probabilidades Se X é uma variável Normal com média µ e desvio padrão σ então: b−µ a−µ a−µ X −µ b−µ Pr(a ≤ X ≤ b) = Pr Pr Z = ≤ ≤ ≤ ≤ = σ σ σ σ σ a−µ b−µ = Φ − Φ σ σ onde Φ é a função de distribuição da N(0,1), que é tabelada. Alguns valores importantes são: Φ(1.645) = 0.95 , Φ (1.96) = 0.975 e Φ (2.326) = 0.99 137 A distribuição Normal Eu pessoalmente prefiro usar a tabela contendo Φ(z0) , mas no final das contas ... dá no mesmo, desde que você saiba qual tabela está usando! O Excel fornece diretamente o valor de Φ(z0) através da função dist.normp. O único argumento para esta função é o valor z0 para o qual você quer calcular a probabilidade de estar abaixo, pois a função pressupõe que a distribuição usada é a Normal padrão (média 0 e variância 1) 138 Tabela da N(0,1) usando Φ(z00) 0.4 0.4 0.3 Φ(z) 0.3 0.2 0.2 0.1 0.1 z - 139 Tabela da N(0,1) - Φ(z00) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 z .0 .0 .0 .0 .0 .1 .1 .1 .1 .1 .2 .2 .2 .2 .2 .3 .3 .3 .3 .3 .4 .4 .4 .4 .4 .5 .5 .5 .5 .5 .6 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 φ(z) .5 0 0 .5 0 8 .5 1 6 .5 2 3 .5 3 1 .5 3 9 .5 4 7 .5 5 5 .5 6 3 .5 7 1 .5 7 9 .5 8 7 .5 9 4 .6 0 2 .6 1 0 .6 1 7 .6 2 5 .6 3 3 .6 4 0 .6 4 8 .6 5 5 .6 6 2 .6 7 0 .6 7 7 .6 8 4 .6 9 1 .6 9 8 .7 0 5 .7 1 2 .7 1 9 .7 2 5 0 0 0 9 9 8 8 7 6 4 3 1 8 6 3 9 5 1 6 0 4 8 0 2 4 5 5 4 3 0 7 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 z .6 .6 .6 .6 .7 .7 .7 .7 .7 .8 .8 .8 .8 .8 .9 .9 .9 .9 .9 .0 .0 .0 .0 .0 .1 .1 .1 .1 .1 .2 .2 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 φ(z) .7 3 2 .7 3 8 .7 4 5 .7 5 1 .7 5 8 .7 6 4 .7 7 0 .7 7 6 .7 8 2 .7 8 8 .7 9 3 .7 9 9 .8 0 5 .8 1 0 .8 1 5 .8 2 1 .8 2 6 .8 3 1 .8 3 6 .8 4 1 .8 4 6 .8 5 0 .8 5 5 .8 5 9 .8 6 4 .8 6 8 .8 7 2 .8 7 7 .8 8 1 .8 8 4 .8 8 8 4 9 4 7 0 2 4 4 3 1 9 5 1 6 9 2 4 5 5 3 1 8 4 9 3 6 9 0 0 9 8 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 z .2 .2 .2 .3 .3 .3 .3 .3 .4 .4 .4 .4 .4 .5 .5 .5 .5 .5 .6 .6 .6 .6 .6 .7 .7 .7 .7 .7 .8 .8 .8 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 φ(z) .8 9 2 .8 9 6 .8 9 9 .9 0 3 .9 0 6 .9 0 9 .9 1 3 .9 1 6 .9 1 9 .9 2 2 .9 2 5 .9 2 7 .9 3 0 .9 3 3 .9 3 5 .9 3 8 .9 4 0 .9 4 2 .9 4 5 .9 4 7 .9 4 9 .9 5 1 .9 5 3 .9 5 5 .9 5 7 .9 5 9 .9 6 0 .9 6 2 .9 6 4 .9 6 5 .9 6 7 5 2 7 2 6 9 1 2 2 2 1 9 6 2 7 2 6 9 2 4 5 5 5 4 3 1 8 5 1 6 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 z .8 .8 .9 .9 .9 .9 .9 .0 .0 .0 .0 .0 .1 .1 .1 .1 .1 .2 .2 .2 .2 .2 .3 .3 .3 .3 .3 .4 .4 .4 .4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 8 0 2 4 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 φ(z) .9 6 8 6 .9 6 9 9 .9 7 1 3 .9 7 2 6 .9 7 3 8 .9 7 5 0 .9 7 6 1 .9 7 7 2 .9 7 8 3 .9 7 9 3 .9 8 0 3 .9 8 1 2 .9 8 2 1 .9 8 3 0 .9 8 3 8 .9 8 4 6 .9 8 5 4 .9 8 6 1 .9 8 6 8 .9 8 7 5 .9 8 8 1 .9 8 8 7 .9 8 9 3 .9 8 9 8 .9 9 0 4 .9 9 0 9 .9 9 1 3 .9 9 1 8 .9 9 2 2 . 9140 927 .9 9 3 1 A distribuição Normal Algumas propriedades da distribuição normal Ela é simétrica em relação à média p(0 ≤ z ≤ z0) = p(-z0 ≤ z ≤ 0) p(z0 ≤ z ≤ z1) = p(-z1 ≤ z ≤ z0) p(-∞ ≤ z ≤ 0) = p(0 ≤ z ≤ +∞) = 0,5 A probabilidade associada a um intervalo equivale à área sob a curva p(z0 ≤ z ≤ z1) = p(0 ≤ z ≤ z1) - p(0 ≤ z ≤ z0) p(-z1 ≤ z ≤ z0) = p(-z1 ≤ z ≤ 0) - p(-z0 ≤ z ≤ 0) = = p(0 ≤ z ≤ z1) - p(0 ≤ z ≤ z0) 141 A distribuição Normal Exemplo: para uma distribuição normal com µ = 10 e σ = 1,5, a probabilidade de 10 ≤ x ≤ 12 é dada por: z0 = (10 – 10)/1,5 = 0 e z1 = (12 – 10)/1,5 = 1,33 p(10 ≤ x ≤ 12) = p(0 ≤ x ≤ 1,33) = 0,4082 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 -4,00 -2,00 0,00 1,33 2,00 4,00 0,00 0,10 0,20 0,30 0,40 0,00 0,0000 0,0398 0,0793 0,1179 0,1554 0,01 0,0040 0,0438 0,0832 0,1217 0,1591 0,02 0,0080 0,0478 0,0871 0,1255 0,1628 0,03 0,0120 0,0517 0,0910 0,1293 0,1664 0,04 0,0160 0,0557 0,0948 0,1331 0,1700 0,50 0,60 0,70 0,80 0,90 0,1915 0,2257 0,2580 0,2881 0,3159 0,1950 0,2291 0,2611 0,2910 0,3186 0,1985 0,2324 0,2642 0,2939 0,3212 0,2019 0,2357 0,2673 0,2967 0,3238 0,2054 0,2389 0,2704 0,2995 0,3264 1,00 1,10 1,20 1,30 1,40 0,3413 0,3643 0,3849 0,4032 0,4192 0,3438 0,3665 0,3869 0,4049 0,4207 0,3461 0,3686 0,3888 0,4066 0,4222 0,3485 0,3708 0,3907 0,4082 0,4236 0,3508 0,3729 0,3925 0,4099 0,4251 142 A distribuição Normal Exemplo: para uma distribuição normal com µ = 10 e σ = 1,5, a probabilidade de 10,95 ≤ x ≤ 12 é dada por z0 = (12 – 10)/1,5 = 1,33 e z1 = (10,95 – 10)/1,5 = 0,63 p(10,95 ≤ x ≤ 12) = p(0,63 ≤ z ≤ 1,33) = p(0 ≤ z ≤ 1,33) - p(0 ≤ z ≤ 0,63) = 0,4082 – 0,2357 = 0,1725 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 -4,00 -2,00 0,63 1,33 0,00 2,00 4,00 0,00 0,10 0,20 0,30 0,40 0,00 0,0000 0,0398 0,0793 0,1179 0,1554 0,01 0,0040 0,0438 0,0832 0,1217 0,1591 0,02 0,0080 0,0478 0,0871 0,1255 0,1628 0,03 0,0120 0,0517 0,0910 0,1293 0,1664 0,04 0,0160 0,0557 0,0948 0,1331 0,1700 0,50 0,60 0,70 0,80 0,90 0,1915 0,2257 0,2580 0,2881 0,3159 0,1950 0,2291 0,2611 0,2910 0,3186 0,1985 0,2324 0,2642 0,2939 0,3212 0,2019 0,2357 0,2673 0,2967 0,3238 0,2054 0,2389 0,2704 0,2995 0,3264 1,00 1,10 1,20 1,30 1,40 0,3413 0,3643 0,3849 0,4032 0,4192 0,3438 0,3665 0,3869 0,4049 0,4207 0,3461 0,3686 0,3888 0,4066 0,4222 0,3485 0,3708 0,3907 0,4082 0,4236 0,3508 0,3729 0,3925 0,4099 0,4251 143 A distribuição Normal Exemplo: dada uma variável X normalmente distribuída com média 6 e desvio-padrão 2, calcule: (a) p(6 ≤ X) (b) p(6 ≤ X ≤ 10) (c) p(8 ≤ X), (d) p(2 ≤ X) (e) p(1 ≤ X ≤ 4) 144 A distribuição Normal Solução: (a) Inicialmente devemos observar que p(6 ≤ X) = p(6 ≤ X ≤ ∞) Normalizando, temos: p(6 ≤ X) = p(0 ≤ Z ≤ ∞) = 0,5 (b) p(6 ≤ X ≤ 10) Normalizando, z0 = (6 – 6)/2 = 0 e z1 = (10 – 6)/2 = 2 p(0 ≤ Z ≤ 2) = 0,4772 (c) p(8 ≤ X) Normalizando, z0 = (8 – 6)/2 = 1 p(1 ≤ Z) = p(1 ≤ Z ≤ ∞) = p(0 ≤ Z ≤ ∞) - p(0 ≤ Z ≤ 1) = 0,5 – 0,3413 = 0,1587 145 A distribuição Normal Solução (cont): (d) p(2 ≤ X) Normalizando: z0 = (2 – 6)/2 = -2 p(-2 ≤ Z) = p(-2 ≤ Z ≤ 0) + p(0 ≤ Z ≤ ∞) Lembrando que p(0 ≤ Z ≤ z1) = p(-z1 ≤ Z ≤ 0), temos p(-2 ≤ Z) = p(0 ≤ Z ≤ 2) + p(0 ≤ Z ≤ ∞) = 0,4772 + 0,5 = 0,9772 (e) p(1 ≤ X ≤ 4) Normalizando, z0 = (1 – 6)/2 = -2,5 e z1 = (4 – 6)/2 = -1 p(-2,5 ≤ Z ≤ -1) = p(1 ≤ Z ≤ 2,5) p(1 ≤ Z ≤ 2,5) = p(0 ≤ Z ≤ 2,5) - p(0 ≤ Z ≤ 1) = 0,4938 – 0,3413 = 0,1525 146 A distribuição Normal Exemplo Numa agência bancária localizada numa grande cidade brasileira, verificou-se que um cliente pessoa física mantém, em média, um volume de R$ 4800,00 aplicados no banco. A dispersão entre os volumes de recursos, medida pelo desvio padrão, é R$ 1600,00. Além disso, pode-se encarar os saldos dos correntistas como independentes entre si e Normalmente distribuídos. O banco pretende abrir uma nova agência e seus executivos imaginam que o poder aquisitivo nesta nova área é semelhante ao dos clientes da agência descrita acima. 147 A distribuição Normal a) Um cliente é VIP se está entre os 5% com maior volume de recursos. Quanto uma pessoa deveria manter no banco para ser considerada cliente VIP? b) O banco pretende cobrar tarifas mais altas dos clientes que têm um baixo volume de recursos aplicados na instituição. Os clientes cujos volumes de recursos estão entre os 10% mais baixos terão de pagar esta tarifa mais alta. Abaixo de qual volume um cliente será alvo desta tarifa diferenciada? 148 A distribuição Normal Solução Seja X a variável que mede o volume de recursos de um cliente típico da agência. Então X é Normal (4800, (1600)2). Daí: Z= X − 4800 1600 tem densidade Normal padrão. a) Para estar entre os 5% mais “ricos”, precisamos encontrar z0 tal que Φ(z0) = 95%. Usando a função INV.NORMP do Excel, encontramos z0 = 1.645. Logo, X − 4800 = 1.645 ⇒ X = 4800 + 1.645(1600) = 7432 1600 149 A distribuição Normal Solução (cont.) b) Para estar entre os 10% mais “pobres” precisamos encontrar z0 tal que Φ(z0) = 10%. A função INV.NORMP do Excel fornece z0 = -1.281. Logo, X − 4800 = −1.281 ⇒ X = 4800 − 1.281(1600) = 2750.40 1600 Ou seja, clientes com volume de recursos abaixo de R$ 2750 estarão sujeitos a uma tarifa mais alta, e aqueles com volume de aplicações acima de R$ 7432 terão tratamento VIP. 150 A distribuição Normal Exemplo O saldo devedor dos usuários de um certo cartão de crédito é uma variável aleatória Normal com média R$ 200 e desvio padrão R$ 75. a) Qual a probabilidade do saldo devedor de um usuário estar entre R$ 100 e R$ 300? b) Qual deve ser o seu saldo devedor para que você esteja entre os 5% mais endividados? Solução X é Normal com média 200 e desvio padrão 75 e assim Z =(X- 200)/75 é N(0,1). 151 A distribuição Normal Solução (cont.) Pr(100 < X < 300) = 300 − 200 100 − 200 Pr <Z< = Pr(−1.333 < Z < +1.333) = Φ (1.333) − Φ (− 1.333) = 2.Φ (1.333) − 1 = 75 75 = 0.8176 b) Para que você esteja entre os 5% mais endividados, o saldo devedor padronizado deve ser igual a 1.645 (veja tabela da Normal). Daí: X − 200 Z= = 1.645 ⇒ X = 200 + 1.645(75) = 323.38 75 é o saldo para estar entre os 5% com maior saldo devedor. 152 A distribuição Normal Exemplo (para casa) O consumo médio residencial de energia elétrica nos meses de verão numa certa cidade é uma variável Normal com média 210 kWh e desvio padrão 18 kWh. a) Qual a probabilidade de que o consumo no verão exceda 225 kWh? b) Calcule a probabilidade de que o consumo no verão seja inferior a 190 kWh. 153 Aproximação Normal da distribuição Binomial Na seção anterior nós estudamos a distribuição binomial A probabilidade de em um experimento binomial com n tentativas ocorrerem exatamente x sucesso, sendo p a probabilidade de um sucesso é dada por: n n! f ( x) = p x (1 − p ) n− x = p x (1 − p ) n− x x!(n − x)! x Quando n é grande, o cálculo de f(x) se torna muito trabalhoso Além disso, as tabelas para a distribuição binomial contemplam apenas alguns valores de n e p Nos casos onde n ≥ 20 e n(1 – p) ≥ 5, a distribuição normal fornece uma boa aproximação da distribuição binomial, com 154 µ = np e σ = √np(1 – p) Aproximação Normal da distribuição Binomial Exemplo: qual é a probabilidade de obtermos exatamente 20 caras em 50 lançamentos consecutivos de uma moeda? Solução: Experimento binomial com n = 50, x = 20 e p = 0,5 n(1 – p) = 50(1 – 0,5) = 25 ≥ 5 e n = 50 ≥ 20, podemos utilizar a aproximação normal com µ = 25 e σ = 3,54 Como queremos calcular a probabilidade para um ponto (x = 20) e em distribuições contínuas só podemos calcular a probabilidade para intervalos, devemos utilizar um artifício: calcular a probabilidade de ocorrência de 19,5 a 20,5 caras – p(19,5 ≤ x ≤ 20,5) 155 Aproximação normal da distribuição binomial Solução (cont.): Normalizando, temos z0 = (19,5 – 25)/3,54 = -1,55 e z1 = (20,5 – 25)/3,54 = -1,27 Logo, devemos calcular Pr(-1,55 ≤ z ≤ -1,27) = 0,4394 – 0,3980 = 0,0414 Calculando diretamente pela fórmula da distribuição binomial obteríamos p = 0,0419 156 Aproximação normal da distribuição binomial Exemplo (para casa) Seja Y uma variável Binomial com n = 20 e p =1/2. Use o Excel para calcular: a) Pr( Y ≥ 15) exatamente b) Pr( Y ≥ 15) aproximadamente pela distribuição Normal 157 A distribuição Exponencial A distribuição exponencial é útil na descrição de variáveis aleatórias tais como tempo entre ocorrências consecutivas de um evento, tempo necessário para realização de uma tarefa etc. Tempo entre chegadas consecutivas de carros em um posto de pedágio Tempo de atendimento em um caixa de banco A função de densidade de probabilidade é definida para x ≥ 0 e é dada por: 0.08 1 f ( x) = e µ − x µ 0.06 µ = 15 0.04 0.02 0 0 10 20 30 40 50 60 158 A distribuição Exponencial Como em qualquer distribuição contínua de probabilidades, a área sob a curva da função densidade de probabilidade para um determinado intervalo fornece a probabilidade de ocorrência de valores dentro desse intervalo p ( x ≤ x0 ) = 1 − e − x0 µ p ( x0 ≤ x ≤ x1 ) = e − x0 µ − e − x1 µ 159 A distribuição Exponencial Exemplo O tempo médio de atendimento em um caixa de um banco é de 1m30s. Supondo que o tempo de atendimento obedece a uma distribuição exponencial, calcule: (a) a probabilidade de um atendimento durar menos de 1m30s e (b) durar entre 1m45s e 3m00s 160 A distribuição Exponencial Solução: temos uma distribuição exponencial com µ = 1,5 (1m30s). (a) para x0 = 1,5, temos: 1 p ( x ≤ 1,5) = 1 − e −1,5 1,5 = 1 − = 0,632 e (b) Devemos calcular a probabilidade para o intervalo (x0, x1) onde x0 = 1,75 e x1 = 3,00 p (1,75 ≤ x ≤ 3,00) = e −1,75 1,5 − e −3,00 1,5 = 0,311 − 0,135 = 0,176 161 Relação entre Distribuições Poisson e Exponencial Se a distribuição de Poisson fornece uma descrição apropriada do número de ocorrências de um evento dentro de um intervalo, a distribuição Exponencial fornece o tempo médio entre ocorrências (“chegadas”) Suponha que o número médio de clientes que entram em uma loja no intervalo de uma hora seja 10 e que essa variável seja descrita por uma distribuição de Poisson O tempo médio entre chegadas de clientes é descrito por uma distribuição exponencial com µ = 1h/10 = 0,1 hora/cliente 162 Relação entre Distribuições Poisson e Exponencial Exemplo A chegada de uma mensagem de e-mail num servidor segue uma distribuição de Poisson com taxa λ= 5 mensagens por minuto. Qual a probabilidade de que o primeiro e-mail demore mais que 20 segundos para chegar? Solução O instante de chegada da 1a. mensagem é uma variável Exponencial com média 1/λ = 1/5 de um minuto = 12 segundos. Denote por T esta variável. Desejamos encontrar Pr( T ≥ 20 segundos) = Pr{ T ≥ 1/3 minuto} = exp{ -5(1/3)} = 18.9%. 163 Exemplo – distribuição Exponencial (para casa) Uma empresa aérea precisa revisar os motores de seus aviões em intervalos regulares de tempo. Existem 2 opções - a revisão rápida e uma revisão mais detalhada e cara. O técnico encarregado da manutenção garante que na revisão rápida o funcionamento perfeito dos motores é uma variável Exponencial com média 400 horas. Após a revisão detalhada o funcionamento perfeito dos motores é uma variável Exponencial com média 600 horas. A revisão detalhada custa R$ 25.000,00 e a revisão rápida R$ 18.000,00. 164 Exemplo – distribuição Exponencial (para casa) O avião precisa funcionar por 500 horas sem problemas de motor para que a operação da companhia seja economicamente viável. Do contrário, se o avião apresentar defeito antes das 500 horas, existe um custo adicional de R$ 20.000,00 devido ao tempo necessário para uma nova manutenção. Qual o custo esperado das duas revisões? Qual procedimento é mais vantajoso, isto é, qual deles tem o menor custo médio? 165 Utilizando o Excel® Funções do Excel para as distribuições Normal e Exponencial Função Descrição dist.normal(x;µ;σ;a) Calcula a função densidade de probabilidade da distribuição normal com média µ e desvio-padrão σ correspondente ao ponto x. Se a = VERDADEIRO, retorna a probabilidade acumulada (de -∞ a x) dist.exp(x;lambda;a) Calcula a função densidade de probabilidade da distribuição exponencial com média 1/lambda correspondente ao ponto x. Se a = VERDADEIRO, retorna a probabilidade acumulada (de 0 a x) 166 Probabilidade e Estatística – Qual a Diferença? Até agora tivemos dois grandes “focos” de atuação: 1) Estatística descritiva – resumir de maneira eficiente uma massa de dados, sem maiores preocupações sobre qual a distribuição de probabilidade que estava “por trás” 2) Probabilidade – apresentar alguns dos modelos probabilísticos mais usuais e as situações em que eles surgem na prática. 167 Probabilidade e Estatística – Qual a Diferença? Mas... Até agora, quando falávamos das diversas distribuições de probabilidade, os seus parâmetros eram CONHECIDOS!!!!! Na prática isso não acontece, e devemos estimar (“chutar educadamente”) os parâmetros da distribuição a partir dos dados observados numa amostra. Isso nos leva ao terreno da “Estatística” (ou “Estatística Inferencial”), em que o nosso objetivo é, a partir de uma amostra, concluir algo sobre os parâmetros das distribuições de probabilidade da população que gerou a amostra. 168 Probabilidade e Estatística – Qual a Diferença? O que se faz em Estatística? Pega-se uma amostra e usa-se esta amostra para concluir algo sobre a população que gerou a amostra. Existem três grandes classes de técnicas estatísticas: Estimação pontual Estimação por intervalos (intervalos de confiança) Testes de hipóteses 169 Estimação pontual Na estimação pontual, utilizamos os dados da amostra para calcular parâmetros que servem como estimativas (“chutes”) dos reais parâmetros da população X é o estimador pontual da média da população µ S é o estimador pontual do desvio-padrão da população σ Pode-se provar que estes estimadores tem propriedades “ótimas” e por isso faz sentido usá-los 170 Distribuição amostral Note que X e S são variáveis aleatórias também, e portanto têm as suas próprias distribuições de probabilidade, caracterizadas por parâmetros como a média e a variância. Estas distribuições de probabilidade dos estimadores X e S são chamadas de distribuições amostrais (“sampling distributions” em inglês) Vamos nos concentrar aqui na distribuição amostral para a média amostral X 171 Distribuição da média amostral X O valor esperado da média amostral é a média da população, isto é: E( X ) = µ O desvio-padrão da distribuição amostral da média é o desvio-padrão da população dividido pela raiz quadrada do número de elementos da amostra σ E (sx ) = n 172 Distribuição da média amostral X Por que isso é importante? Note que, à medida que o tamanho da amostra (n) cresce, o desvio padrão de X diminui, indicando que X vai se tornando uma estimativa cada vez mais precisa da média (desconhecida) da população (que é o µ) Também... O Teorema Central do Limite garante que a distribuição de X se torna APROXIMADAMENTE Normal quando n é grande – em geral usamos a aproximação se n ≥ 30 173 Intervalos de Confiança para a Média Objetivo A partir de uma amostra, encontrar um intervalo (L, U), onde L e U dependem dos valores observados na amostra, tal que a média desconhecida (µ) esteja dentro deste intervalo com uma probabilidade especificada 1 – α, ou seja: Pr( L < µ < U) = 1 - α 174 Intervalos de Confiança para a Média Os limites do intervalo (L e U) dependerão dos valores efetivamente observados em cada amostra. O número 1- α é chamado de coeficiente de confiança do intervalo. Dizemos que o intervalo (L, U) é um intervalo de confiança 100.(1-α)% Suponha que X1, X2, ..., Xn são independentes Normais com média µ e variância σ2. O caso mais simples consiste em encontrar um intervalo para a média quando a variância é conhecida. 175 Intervalo de Confiança para a Média O intervalo de confiança para a média representa uma faixa de valores dentro da qual existe uma probabilidade da real média da população se encontrar A essa probabilidade damos o nome de nível de confiança α = 1 – nível de confiança Definiremos o intervalo de confiança para 4 situações: O desvio-padrão da população (σ) é conhecido e a amostra é grande (n ≥ 30) O desvio-padrão da população (σ) é conhecido e a amostra é pequena (n < 30) O desvio-padrão da população (σ) não é conhecido e a amostra é grande (n ≥ 30) O desvio-padrão da população (σ) não é conhecido e a amostra 176 é pequena (n < 30) Caso I - IC para a média: n ≥ 30 e σ conhecido O IC 100(1-α)% é dado por: σ σ , X + zα . X ± zα . = X − zα . n n n 2 2 2 σ onde zα/2 é o ponto da distribuição Normal padrão tal que Pr(Z < zα/2) = 1- α/2 e Z é uma variável N(0,1). Aqui X é a média amostral, σ é o desvio-padrão da população (conhecido) e n é o tamanho da amostra. 177 Caso I - IC para a média: n ≥ 30 e σ conhecido Exemplo Considere a população de alunos do Ibmec. Para uma amostra de 50 alunos obtivemos uma altura média de 1,68m. Sabe-se que o desvio-padrão da altura da população de alunos do Ibmec é o mesmo que o da população de jovens cariocas com menos de 25 anos: 0,11m. Determine, com um nível de confiança de 95%, o intervalo onde a real altura média da população de alunos do Ibmec deve estar localizada. 178 Caso I - IC para a média: n ≥ 30 e σ conhecido Solução n ≥ 30 – a distribuição amostral da média é normal (pelo teorema central do limite) σ é conhecido Da tabela da Normal, ou usando a função INV.NORMP do Excel, procuramos um valor z0 tal que Pr(Z < z0) = 1- α/2 = 97.5% , isto é, Φ(z0) = 97.5%. A função INV.NORMP fornece z0 = 1.96. 179 Caso I - IC para a média: n ≥ 30 e σ conhecido Solução (cont.) O IC 95% é então: σ σ 11 11 X − zα . X + z = − + , . 168 1 . 96 , 168 1 . 96 α n n 50 50 2 2 = (164.95 cm, 171.05 cm ) 180 Caso I - IC para a média: n ≥ 30 e σ conhecido Receita de bolo – qual valor de zα/2 usar? Coeficiente de Confiança 80.0% 90.0% 95.0% 97.0% 97.5% 99.0% valor tabelado de z 1.282 1.645 1.960 2.170 2.241 2.576 181 Caso I - IC para a média: n ≥ 30 e σ conhecido Exemplo: calcule o intervalo de confiança, com um nível de confiança de 80%, para uma amostra com 49 elementos com média igual a 4 e desvio-padrão da população igual a 0,8 Solução: X = 4; n = 49; σ = 0,3 e α/2 = 0,1 da tabela da normal temos z = 1,28 0,8 x = 4 ± 1,28. = 4 ± 0,146 49 182 Caso I - IC para a média: n ≥ 30 e σ conhecido Exemplo Numa amostra de 36 postos de gasolina no Rio de Janeiro, o preço médio do litro da gasolina aditivada foi de R$ 1.78. Sabe-se, por experiências anteriores, que o desvio padrão é R$ 0.20. Encontre intervalos de confiança 90%, 95% e 99% para o preço médio da gasolina aditivada no Rio de Janeiro. Solução Aqui estamos supondo que o desvio padrão é conhecido, e também o tamanho da amostra excede 30, e assim podemos usar a densidade Normal. 183 Caso I - IC para a média: n ≥ 30 e σ conhecido Os IC têm a forma geral: X − z . σ , X + z . σ α α O IC 90% é: 2 n 2 n ( ( 0.20) 0.20) ,1.78 + 1.645 = (R$ 1.725, R$ 1.835) 1.78 − 1.645 6 6 O IC 95% é: ( ( 0.20) 0.20) ,1.78 + 1.96 1.78 − 1.96 = (R$ 1.715, R$ 1.845) 6 6 O IC 99% é: (0.20) ,1.78 + 2.576 (0.20) = (R$ 1.694, R$ 1.866) 1 . 78 − 2 . 576 6 6 Note que, à medida que o coeficiente de confiança aumenta, a largura do intervalo também aumenta! 184 Caso II - IC para a média: n ≥ 30 e σ desconhecido Quando nós não conhecemos o desvio-padrão da população, utilizamos o desvio-padrão da amostra, s, como estimador O intervalo de confiança para a média é definido por: s s s = X − zα . X ± zα . , X + zα . n n n 2 2 2 onde X é a média amostral, s é o desvio-padrão da amostra, n é o tamanho da amostra, α/2 = (1 – nível de confiança)/2 e zα/2 é obtido da tabela da curva normal da mesma maneira que no caso I, isto é Φ(zα/2)= Pr(Z < zα/2) = 1- α/2 . A única diferença entre este caso e o anterior é a substituição do desvio padrão amostral s pelo desvio 185 padrão da população. Caso II - IC para a média: n ≥ 30 e σ desconhecido Exemplo: calcule o intervalo de confiança, com 90% de chance, para uma amostra com 64 elementos, média igual a 10 e desvio-padrão igual a 3 Solução: x = 10; n = 64; σ = 3 e α/2 = 0,05 da tabela da normal temos z = 1,645 3 IC = 10 ± 1,645. = 10 ± 0,617 = (9.383, 10.617 ) 64 186 Caso III - IC para a média: n < 30 e σ conhecido Nesse caso (n < 30), a distribuição amostral da média depende da distribuição da população Se a população for normal (ou aproximadamente normal), a distribuição amostral da média será normal, independente de n Podemos então utilizar os procedimentos descritos para n ≥ 30 e σ conhecido: IC = X ± zα . 2 σ n Se a distribuição da população não for normal, a única solução é aumentar o tamanho da amostra (n ≥ 30 ) para que a distribuição de X possa ser aproximada por uma 187 normal Caso IV - IC para a média: n < 30 e σ desconhecido Assumindo que a população é normalmente distribuída, nós podemos utilizar o desvio-padrão da amostra como estimador do desvio-padrão da população Como o desvio-padrão da população é desconhecido, ao invés de utilizarmos distribuição normal para o cálculo do intervalo de confiança, nós utilizamos a distribuição t de Student: s s s IC = X ± tα . = X − tα . , X + tα . n n n 2 2 2 A distribuição t é semelhante à normal – simétrica com forma de sino – e possui um parâmetro a mais: o número de graus de liberdade = n – 1 188 Caso IV - IC para a média: n < 30 e σ desconhecido O valor tα/2 é obtido de uma tabela da distribuição t com n-1 graus de liberdade, de tal forma que Pr(T < tα/2 ) = α/2. Pode-se, alternativamente, usar a função INVT do Excel. 189 Caso IV - IC para a média: n < 30 e σ desconhecido Exemplo Numa amostra de 16 postos de gasolina no Rio de Janeiro, o preço médio do litro da gasolina aditivada foi de R$ 1.78. O desvio padrão dos preços estimado na amostra é R$ 0.20. Encontre intervalos de confiança 90%, 95% e 99% para o preço médio da gasolina aditivada no Rio de Janeiro e compare-os com os encontrados no exemplo da página 179. 190 Caso IV - IC para a média: n < 30 e σ desconhecido Solução A situação aqui é exatamente a descrita no caso IV, pois o tamanho da amostra é “pequeno” e o desvio padrão é desconhecido, e então devemos usar um IC baseado na distribuição t. A forma do intervalo é: IC = X ± tα . 2 s s s = X − tα . , X + tα . n n n 2 2 Pela função INVT do Excel com 15 graus de liberdade obtemos os pontos percentuais para os IC 90, 95 e 99%, que são, respectivamente: 1.753, 2.131 e 2.947. 191 Caso IV - IC para a média: n < 30 e σ desconhecido O IC 90% é: (0.20) ,1.78 + 1.753 (0.20) = (R$ 1.692, R$ 1.868) − 1 . 78 1 . 753 4 4 O IC 95% é: ( ( 0.20) 0.20) ,1.78 + 2.131 1.78 − 2.131 = (R$ 1.673, R$ 1.887 ) 4 4 O IC 99% é: (0.20) ,1.78 + 2.947 (0.20) = (R$ 1.633, R$ 1.927 ) 1 . 78 − 2 . 947 4 4 Note que os intervalos de confiança são maiores que os correspondentes para a Normal 192 Caso IV - IC para a média: n < 30 e σ desconhecido Nota IMPORTANTE – uso de INVT no Excel Suponha que você quer encontrar um intervalo de confiança 100*(1 – α)%. Então para obter o ponto tα/2 que entra no cálculo do IC, use a função INVT com os argumentos: α e n – 1 graus de liberdade Isso se deve ao fato do primeiro argumento da função no Excel ser, na verdade, o valor para o intervalo bilateral 193 Distribuição t de Student Quando n (número de graus de liberdade) cresce, a densidade se torna cada vez mais parecida com uma N(0,1) Densidades t de Student e N(0,1) 0.5 0.4 0.4 0.3 N(0,1) 0.3 t(2) t(5) 0.2 t(10) 0.2 0.1 0.1 2. 3 2 1. 7 1. 4 1. 1 0. 8 0. 5 0. 2 -0 .1 -0 .4 -0 .7 -1 -1 .3 -1 .6 -1 .9 -2 .2 -2 .5 - 194 A distribuição t de Student Exemplo: para uma amostra com 15 elementos (14 graus de liberdade) e para um nível de confiança de 5% (α/2 = 0,025), t é igual a 2,1448 G.L 0,45 0,40 1 2 3 4 0,100 3,0777 1,8856 1,6377 1,5332 0,075 4,1653 2,2819 1,9243 1,7782 0,050 6,3137 2,9200 2,3534 2,1318 0,025 12,7062 4,3027 3,1824 2,7765 0,020 15,8945 4,8487 3,4819 2,9985 5 6 7 8 9 1,4759 1,4398 1,4149 1,3968 1,3830 1,6994 1,6502 1,6166 1,5922 1,5737 2,0150 1,9432 1,8946 1,8595 1,8331 2,5706 2,4469 2,3646 2,3060 2,2622 2,7565 2,6122 2,5168 2,4490 2,3984 10 11 12 13 14 1,3722 1,3634 1,3562 1,3502 1,3450 1,5592 1,5476 1,5380 1,5299 1,5231 1,8125 1,7959 1,7823 1,7709 1,7613 2,2281 2,2010 2,1788 2,1604 2,1448 2,3593 2,3281 2,3027 2,2816 2,2638 15 16 1,3406 1,3368 1,5172 1,5121 1,7531 1,7459 2,1315 2,1199 2,2354 195 0,35 0,30 0,25 0,20 0,15 α/2 0,10 0,05 0,00 -4,00 -2,00 0,00 2,1448 2,00 4,00 2,2485 Comparação: IC Normais x IC t de Student A distribuição t nos fornece intervalos de comprimento maior que os intervalos Normais com a mesma probabilidade. À medida que o número de graus de liberdade da densidade t cresce, a densidade se torna mais e mais parecida com uma N(0,1), e consequentemente, os intervalos se tornam mais próximos dos encontrados através da distribuição N(0,1). 196 Determinando o tamanho da amostra para um dado nível de confiança Até o momento, o tamanho da amostra era um dado do problema Muitas vezes nós temos a flexibilidade de determinar o tamanho da amostra Nesse caso, a margem de erro é um dado do problema Podemos então, dado o nível de confiança desejado e os parâmetros descritivos da amostra, obter a margem de erro desejada ajustando o tamanho da amostra 197 Determinando o tamanho da amostra para um dado nível de confiança A margem de erro E é dada por (σ conhecido): E = zα . 2 σ n Resolvendo para n, temos: zα2 / 2 σ 2 n= E2 A fórmula acima exige o conhecimento do desvio-padrão da população, σ. Na maioria dos casos isso não ocorre. Na prática, podemos utilizar o desvio-padrão de uma outra amostra da mesma população como estimador de σ 198 Determinando o tamanho da amostra para um dado nível de confiança Exemplo: uma amostra de funcionários de uma subsidiária de uma grande empresa multinacional mostrou que eles gastam, em média, 25 dias de trabalho por ano em treinamento. Sabe-se, através de estudos anteriores, que o desviopadrão dessa medida é de 5 dias. O diretor de RH da empresa quer saber com um nível de confiança de 95% e um erro máximo de 1 dia, o tempo médio de treinamento de seus funcionários. Que tamanho a nova amostra deve ter? 199 Determinando o tamanho da amostra para um dado nível de confiança Solução: σ = 5, α/2 = 0,025, E = 1 Da tabela da normal temos que zα/2 = 1,96 Utilizando a fórmula, temos: zα2 / 2σ 2 (1,96) 2 52 n= = = 96 2 2 E 1 200 Utilizando o Excel® Funções do Excel para a distribuição t Função invt(p; gl) Descrição Para a distribuição t de Student, calcula o valor t para p = 2 x α, com gl graus de liberdade 201 Utilizando o Excel® O Excel também pode ser utilizado para o cálculo do intervalo de confiança para σ desconhecido (para qualquer tamanho de amostra) Selecione no menu Ferramentas a opção Análise de Dados Selecione a opção Estatística Descritiva Na caixa Intervalo de Entrada, selecione os dados da amostra Selecione a opção Intervalo de Confiança para a Média e coloque o intervalo de consiança desejado Na caixa Intervalo de Saída, selecione o local da planilha onde os resultados serão colocados Clique em Ok 202 Utilizando o Excel® A saída Erro padrão fornece o valor de σ/√n para n grande Para obter o intervalo de confiança, calcule zα/2 utilizando a função apropriada, multiplique pelo Erro padrão, subtraia e some à média A saída Intervalo de Confiança já fornece o valor de tα/2σ/√n para n pequeno, bastando apenas subtrair e somar à média 203 Testes de Hipóteses Objetivo geral Inferir sobre os parâmetros desconhecidos de uma população usando uma amostra (de tamanho possivelmente reduzido). Testar hipóteses é um problema que envolve a tomada de uma decisão. Eventualmente, após “recolhermos” (ou processarmos) a informação contida numa amostra, devemos chegar a uma conclusão sobre parâmetros não observáveis relacionados à população que gerou aquela amostra 204 Testes de Hipóteses Qual o teste ideal? É aquele que sempre toma a decisão correta. É claro que isso é uma abstração, e não existe na realidade. Na prática ... Procuraremos limitar a probabilidade de um certo tipo de erro, mas não se pode descartá-lo totalmente. 205 Testes de Hipóteses O Teste de Hipóteses é um procedimento em que procuramos testar uma hipótese inicial contra uma alternativa. A primeira hipótese (hipótese inicial) é denominada hipótese nula e representada por H0 . A segunda hipótese é chamada hipótese alternativa e representada por Ha . Em geral a hipótese alternativa representa uma conjectura nova a ser testada, e a hipótese nula representa a situação usual, o "status quo". 206 Testes de Hipóteses A partir dos dados observados, como podemos decidir sobre qual hipótese (nula ou alternativa) deverá ser rejeitada? A rejeição da hipótese nula implica na aceitação da hipótese alternativa e vice-versa. Não é possível aceitar (ou rejeitar) ambas as hipóteses simultaneamente. 207 Testes de Hipóteses O que é um teste de hipóteses? É qualquer regra usada para nos levar à decisão sobre qual hipótese devemos aceitar. Podemos criar um número infinito de testes de hipóteses, o problema é identificar quais são os bons testes, e tentar obter um "algoritmo" para criar bons testes em diversas situações. Aqui nós estaremos concentrados em obter testes de hipóteses para a média de distribuições. 208 48 Testes de Hipóteses Inicialmente devemos formular a hipótese a ser testada (hipótese nula ou H0) e da hipótese alternativa (Ha) Existem três possibilidades: H 0 : µ ≥ µ0 H 0 : µ ≤ µ0 H 0 : µ = µ0 H a : µ < µ0 H a : µ > µ0 H a : µ ≠ µ0 Em seguida, a partir de informações da amostra e do nível de significância desejado, vamos procurar evidências que indiquem se a hipótese nula pode ou não ser rejeitada 209 Construção de um Teste de Hipóteses Teste Rejeitar H0 se T(x), uma função apropriada dos Xi’s da amostra, está numa região especificada R. Do contrário, se T(x) não está na região R, não rejeitamos a hipótese nula. A região R é chamada de região de rejeição ou região crítica. 210 Erros do Tipo I e II A partir do que foi observado na amostra podemos tomar a decisão de aceitar ou rejeitar H0 e esta decisão não é necessariamente correta, como mostra a tabela a seguir. Aceitar H0 (Rejeitar H1) Decisão tomada → Estado da realidade ↓ H0 é verdadeira DECISÃO CORRETA (H1 é falsa) H1 é verdadeira Erro do tipo II (H0 é falsa) Rejeitar H0 (Aceitar H1) Erro do tipo I DECISÃO CORRETA 211 Erros do Tipo I e II A eficiência do teste pode ser medida através das probabilidades dos erros de tipo I e II. Idealmente gostaríamos que a probabilidade de incorrermos em qualquer tipo de erro fosse zero, mas isto não é possível . Para um tamanho de amostra fixo também não é possível fixarmos ambos os erros de tipo I e II. 212 Erros do Tipo I e II α = Probabilidade de erro do tipo I α = Pr{ rejeitar H0 | H0 é verdadeira } α = Pr{ T(x) na região crítica | H0 é verdadeira } α é chamado de tamanho do teste ou nível de significância do teste. β = Probabilidade de erro do tipo II β = Pr{ aceitar H0 | H0 é falsa } β = Pr{ T(x) fora da região crítica| H0 é falsa } 213 Potência de um Teste Potência do teste (ou poder do teste) 1− β = 1- Probabilidade de erro do tipo II 1− β = Pr{ rejeitar H0 | H0 é falsa } Ou seja, a potência do teste é a probabilidade de uma decisão correta! Idealmente, a potência de um teste seria sempre alta, mas isso não é sempre verdade. 214 Teste de hipótese uni-caudal Vamos começar desenvolvendo o teste de hipótese para o caso abaixo com uma amostra grande (n ≥ 30) e σ da população conhecido H 0 : µ ≥ µ0 H a : µ < µ0 Definimos o nível de significância α tal que, sendo a hipótese nula falsa, queremos ter uma probabilidade máxima α de aceitá-la Podemos utilizar os conceitos desenvolvidos na seção anterior (intervalos de confiança) para definir a regra de rejeição da hipótese nula 215 Teste de hipótese uni-caudal Vamos assumir inicialmente que a hipótese nula seja verdadeira Para uma amostra grande, podemos considerar a distribuição amostral da média praticamente normal Dado um nível de significância α, o valor de z abaixo do qual há uma probabilidade α da média de uma amostra estar localizada (zα) é obtido diretamente da tabela da normal Calculando o valor de z para a média da amostra, temos a seguinte regra de rejeição: Rejeitar H 0 se z = x − µ0 < − zα σ n 216 Teste de hipótese uni-caudal Para o caso de uma amostra grande com σ da população desconhecido, o procedimento é o mesmo, bastando utilizar o desvio-padrão amostral s como estimador de σ Rejeita H 0 se z = x − µ0 < − zα s n Os testes apresentados são conhecidos como testes unicaudais ou unilaterais, pois a hipótese é formulada como “maior ou igual a” ou “menor ou igual a” 217 Teste de hipótese uni-caudal Exemplo: Uma empresa produz café em pó em embalagens de 1Kg. O gerente de produção deseja saber se as embalagens realmente possuem em média 1Kg do produto e decidiu realizar um teste. Ele retirou uma amostra de 50 embalagens e obteve uma um peso médio de 0,985Kg de produto. Informações anteriores a respeito da quantidade de produto por embalagem indicaram um desvio-padrão de 0,075Kg. O gerente deseja saber, com um nível de significância de 1% se o conteúdo de cada embalagem é de, no mínimo, 1Kg. 218 Teste de hipótese uni-caudal Solução: As hipóteses nula e alternativa para o teste são: H0 : µ ≥ 1 Ha : µ < 1 O valor de zα para o teste é (a partir da tabela normal) de 2,33 A regra de rejeição é: x − µ0 0,985 − 1 = = −1,41 < − zα = −2,33 Rejeita H 0 se z = σ n 0,075 50 Como z > zα, a hipótese nula não pode ser rejeitada Se σ não fosse conhecido, deveríamos utilizar o desviopadrão da amostra s 219 VALOR de p (“p value”) Muitos softwares estatísticos calculam e exibem o “pvalue”, que é a probabilidade de que a estatística de teste tenha pelo menos tão extremo (muito grande ou muito pequeno) quanto o valor encontrado na amostra. O “valor-p” (p-value) indica o menor nível de significância que levaria à rejeição da hipótese nula. Por exemplo, se o p-value é 0.04, a hipótese H0 seria rejeitada com nível 5%, mas não com nível 1%. 220 Teste de hipótese uni-caudal Uma outra abordagem para realizarmos o teste de hipótese é utilizarmos o “valor-p” Supondo que a hipótese nula seja verdadeira, o “valor-p” nos dá a probabilidade de obtermos um valor menor ou igual a média amostral A hipótese nula é rejeitada se essa probabilidade (valor-p) for menor que o nível de significância definido para o teste Rejeitar H 0 se " valor - p" < α 221 Teste de hipótese uni-caudal Utilizando os dados do exemplo anterior, temos que z = -1,41 corresponde a uma probabilidade de 0,0793 da média amostral (0,985Kg) ser menor que µ0 (1Kg) Logo, " valor - p" = 0,0793 > α = 0,01 Portanto não podemos rejeitar a hipótese nula Independente da abordagem utilizada (zα ou “valor-p”), devemos sempre obter o mesmo resultado para o teste de hipótese (aceitação ou rejeição de H0) 222 Teste de hipótese uni-caudal Outra forma de teste uni-caudal é mostrado abaixo H 0 : µ ≤ µ0 H a : µ > µ0 Este teste é semelhante ao anterior, só que nesse caso consideramos a cauda superior da curva normal A regra de rejeição é dada por: x − µ0 Rejeita H 0 se z = > zα , se σ for conhecido σ n Rejeita H 0 se z = x − µ0 > zα , se σ for desconheci do s n O valor-p é calculado de forma análoga, só que nesse caso ele representa a probabilidade de obtermos um valor maior ou igual à média amostral 223 Teste de hipótese bi-caudal Agora vamos analisar um teste de hipótese bi-caudal, para uma amostra grande (n ≥ 30) e σ da população conhecido H 0 : µ = µ0 H a : µ ≠ µ0 Definimos o nível de significância α tal que, sendo a hipótese nula falsa, queremos ter uma probabilidade máxima α de aceitá-la Este teste difere do anterior (uni-caudal) pois a região de rejeição situa-se tanto acima (cauda direita) quanto abaixo de µ0 (cauda esquerda) 224 Teste de hipótese bi-caudal Vamos assumir inicialmente que a hipótese nula seja verdadeira Para uma amostra grande, podemos considerar a distribuição amostral da média praticamente normal Agora, dado um nível de significância α, devemos considerar dois valores de z Um, abaixo do qual há uma probabilidade α/2 da média de uma amostra estar localizada (– zα/2) Outro, acima do qual há uma probabilidade α/2 da média de uma amostra estar localizada (zα/2) A regra de rejeição é: Rejeita H 0 se z = x − µ0 < − zα / 2 ou z > zα / 2 σ n 225 Teste de hipótese bi-caudal Para o cálculo do valor-p, devemos levar em conta que o teste em questão é bi-caudal A probabilidade obtida a partir do cálculo de z deve ser multiplicada por 2 para que possa ser comparada com α Desta forma, podemos utilizar a mesma regra de rejeição que para o caso do teste uni-caudal Rejeitar H 0 se " valor - p" < α 226 Teste de hipótese bi-caudal Exemplo Um fabricante de autopeças utiliza esferas de aço na fabricação de rolamentos. Essas esferas devem ter um diâmetro de 12mm, caso contrário os rolamentos não atingem as especificações exigidas. Uma amostra de 30 rolamentos escolhidos ao acaso forneceu um diâmetro médio de 11,45mm e um desvio-padrão de 1mm. Pode-se dizer que o diâmetro médio dos rolamentos utilizados é igual a 12mm com um nível de significância de 5%? 227 Teste de hipótese bi-caudal Solução: Trata-se de um teste de hipótese bi-caudal, com α = 0,05, onde: H 0 : µ = 12 H a : µ ≠ 12 Para α _ = 0,05, z α/2 = 1,96 Para x = 11,45mm, temos z = -3,01 < - z podemos rejeitar a H0 α/2, portanto _ Valor-p: calculando a probabilidade de x < x (z < -3,01), encontramos 0,0003 Logo, o valor-p = 0,0006 < α/2 = 0,025, portanto podemos rejeitar H0 228 Teste de hipótese – amostra pequena Até o momento, consideramos o caso de uma amostra grande (n ≥ 30) Para n < 30, podemos ter as seguintes possibilidades A população é normalmente distribuída e σ é conhecido: utilizamos o mesmo procedimento que para o caso de n ≥ 30, com σ conhecido A população é normalmente distribuída e σ não é conhecido: utilizamos o mesmo procedimento que para o caso de n ≥ 30, utilizando s como estimador de σ e utilizando a distribuição t ao invés da normal A população não é normalmente distribuída : aumentamos o tamanho da amostra 229 Teste de hipótese – amostra pequena Exemplo Uma revista especializada decidiu realizar uma pesquisa sobre a qualidade de serviço em grandes aeroportos ao redor do mundo. O nível de serviço de um aeroporto é considerado superior se a nota obtida é igual ou superior a 7. Para o aeroporto de Heatrow, em Londres, foram entrevistadas 12 pessoas que atribuiram as seguintes notas: 7, 8, 10, 8, 6, 9, 6, 7, 7, 8, 9, e 8. Determine, com un nível de significância de 5%, se o serviço do aeroporto de Heatrow pode ser considerado superior. Suponha que a população é normalmente distribuída. 230 Teste de hipótese – amostra pequena Solução: As hipóteses nula e alternativa para o teste são: H0 : µ ≤ 7 Ha : µ > 7 Com uma população normal, n < 30 e σ desconhecido, utilizaremos s e a distribuição t com 11 graus de liberdade para o teste A média da amostra é 7,75 e s = 1,215 O valor de tα para o teste é 1,796 A regra de rejeição é x − µ0 7,75 − 7 Rejeita H 0 se t = > tα ⇒ t = = 2,14 > tα = 1,796 1,215 12 s n Portanto, temos evidências para rejeitar a hipótese nula 231 Teste de hipótese – tamanho da amostra O nível de significância de um teste de hipótese define a probabilidade de Erro Tipo I Controlando o temanho da amostra, podemos também controlar a probabilidade de Erro Tipo II 232 Teste de hipótese – tamanho da amostra Vamos considerar inicialmente o teste abaixo: H 0 : µ ≥ µ0 H a : µ < µ0 O limite inferior de aceitação de H0 é: σ xmin = µ 0 − zα n Se desejarmos uma probabilidade β para o Erro Tipo II se a verdadeira média da população for µ1, devemos ter: x − µ1 zβ = min σ n Resolvendo para n as duas equações acima, obtemos: ( zα + zβ )2 σ 2 n= (µ 0 − µ1 )2 233 Teste de hipótese – tamanho da amostra Exemplo: Considerando os dados do exemplo anterior, o gerente de qualidade fez duas afirmativas acerca do teste em questão Se a duração média das baterias do lote for igual ou superior a 120 hs, estou disposto a correr um risco de 5% de rejeitá-lo Se a duração média das baterias do lote for igual ou inferior a 115 hs, estou disposto a correr um risco de 10% de aceitá-lo Quantas baterias ele deve testar? 234 Teste de hipótese – tamanho da amostra Solução: α = 0,05, β = 0,1, µ0 = 12 e µ1 = 115. Da tabela normal temos: zα = 1,645 zβ = 1,28 Calculando n obtemos: ( zα + zβ )2 σ 2 (1,645 + 1,28)212 2 n= = = 49,28 (µ 0 − µ1 )2 (120 − 115)2 Logo, devemos retirar uma amostra de 50 baterias 235 Teste de hipótese – tamanho da amostra Considerando o teste abaixo: H 0 : µ ≥ µ0 ¾ H a : µ < µ0 O limite superior de aceitação de H0 é: σ xmax = µ 0 + zα n Se desejarmos uma probabilidade β para o Erro Tipo II se a verdadeira média da população for µ1, devemos ter: µ −x zβ = 1 max σ n Resolvendo para n as duas equações acima, obtemos: ( zα + zβ )2 σ 2 n= (µ1 − µ 0 )2 236 Exemplo (para casa) Toma-se uma amostra dos preços de um certo carro popular anunciados no jornal. Consideramos apenas carros com 1 ano de uso. A amostra contém 10 carros, o preço médio é R$9500 e o desvio padrão dos preços é R$ 1200. O mesmo carro, novo, custa R$ 12500 na concessionária. Investigue a hipótese de que a depreciação no primeiro ano seja maior que 20%. 237 Regressão Linear Modelos de regressão linear relacionam uma variável dependente ou variável de resposta, Y, a uma ou mais variáveis explicativas (também chamadas covariáveis ou variáveis independentes), X. O modelo é linear nos parâmetros que relacionam Y aos X’s. A estimação destes modelos é geralmente feita por mínimos quadrados ordinários, e os estimadores obtidos por este algoritmo são ótimos sob certas condições, dadas pelo teorema de Gauss e Markov. 238 Objetivos dos Modelos de Regressão Linear Estudar a relação entre variáveis, para se testar causalidade (linear) entre as variáveis (ECONOMETRIA). (ii) Possibilitar análises de cenários ("What if analysis") (iii) Permitir eventualmente a previsão da variável dependente. (SÉRIES TEMPORAIS, REGRESSÃO DINÂMICA) 239 REGRESSÃO LINEAR SIMPLES Dependência Linear entre X e Y O diagrama de dispersão tem o seguinte aspecto: 240 Regressão Linear Simples Só uma variável explicativa Y = β 0 + β1.x + ε Modelo: Estão disponíveis n pares de observações (xi, yi) ε é um erro aleatório com média zero e variância constante σ2 . Em muitas situações supomos que o erro é Normal, o que nos permite obter intervalos de confiança e realizar testes de hipóteses. 2 Parâmetros desconhecidos: β 0 , β 1 e σ A equação que descreve a forma como y está relacionada a x é chamada de modelo de regressão 241 Regressão Linear Simples No caso de regressão linear simples, temos: y = β0 + β1x + ε ε é uma variável aleatória chamada de erro da regressão e representa a variação de y que não pode ser explicada por sua relação linear com x – por definição, seu valor esperado é zero Portanto, o valor esperado ou valor médio de y está relacionado com x através de E(y) = β0 + β1x O gráfico da relação entre x e y é uma reta (reta de regressão) β0 é chamado de intercepto β1 é chamado de inclinação 242 Estimação do modelo de regressão linear simples Se os parâmetros β0 e β1 fossem conhecidos, nós poderíamos utilizar o modelo de regressão linear simples para determinar o valor esperado de y para um dado valor de x Na prática, esses valores não são conhecidos e necessitam ser estimados Utilizamos observações emparelhadas de x e y para determinar os estimadores de β0 e β1 – b0 e b1 respectivamente, obtendo a seguinte equação de regressão yˆ = b + b x 0 1 243 Estimação do modelo de regressão linear simples Para determinação de b0 e b1 utilizamos o método dos mínimos quadrados Nesse método, os valores de b0 e b1 são tais que a soma dos quadrados das diferenças entre os valores de ^ respectivos valores estimados y observados (yi) e seus pela equação de regressão (yi) é mínima: n min ∑ ( yi − yˆi )2 i =1 Os valores de b0 e b1 são dados por: b1 = xi ∑ yi ∑ ∑ xi yi − n 2 xi ) ( ∑ − ∑ n xi2 b0 = y − b1 x 244 Estimação do modelo de regressão linear simples Exemplo: o diretor de uma cadeia de restaurantes de fast-food acredita que o volume de vendas de suas lojas seja positivamente relacionado à população situada em um raio de 3 km. Determine essa relação. Loja População Vendas (mil) (R$ mil) 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 26 202 245 Estimação do modelo de regressão linear simples Solução: calculando os termos parciais obtemos: n = 10 ∑ xi = 140 ∑ yi = 1.300 ∑ xi yi = 21.040 2 ∑ xi = 2.528 Logo, 21.040 − (140)(1.300) / 10 =5 2 2.528 − (140) / 10 140 1.300 b0 = −5 = 60 10 10 yˆ = 60 + 5 x b1 = 246 Estimação do modelo de regressão linear simples A reta de regressão juntamente com as observações 200 150 100 50 0 5 10 15 20 25 30 247 Estimação do modelo de regressão linear simples Se nós acreditamos que a equação de regressão obtida reflete a relação de y com x, podemos realizar algumas previsões Por exemplo, se o diretor resolvesse instalar uma loja em uma região cuja população em um raio de 3 km fosse de 16.000 pessoas, as vendas projetadas seriam de: yˆ = 60 + 5.16 = 140 248 Ajuste do modelo de regressão aos dados utilizados O modelo de regressão desenvolvido aproxima a relação linear entre as variáveis x e y Uma pergunta importante: quão bem o modelo de regressão representa essa relação linear? O coeficiente de determinação da regressão nos dá uma medida do ajuste do modelo de regressão aos dados utilizados 249 Ajuste do modelo de regressão aos dados utilizados O i-ésimo resíduo é a diferença entre o valor observado yi e o valor estimado pela equação de regressão, e representa o erro obtido ao estimarmos yi. Ou seja: ei = yi − yˆ i = yi − b0 − b1 xi O método de mínimos quadrados encontra os coeficientes b0 e b1 que minimizam a soma dos quadrados desses resíduos. Chamamos essa quantidade de soma dos quadrados devido ao erro, SSE (do inglês sum of squares due to error) SSE = ∑ ( yi − yˆ i ) 2 250 Ajuste do modelo de regressão aos dados utilizados Agora suponha que nos tenha sido pedido que realizassemos estimativas para a variável dependente y a partir apenas de seus valores observados, yi Sem o conhecimento de nenhuma variável explicativa, ou seja, sem o modelo de regressão, a nossa melhor _ estimativa seria o valor médio das observações de y, y _ Para a i-ésima observação de y, yi, a diferença yi – y nos fornece uma _ medida do erro cometido ao estimarmos y a partir de y Definimos como soma total dos quadrados, SST (do inglês total sum of squares), a soma do quadrado dessas diferenças 2 SST = ∑ ( yi − y ) 251 Ajuste do modelo de regressão aos dados utilizados Agora suponha que tenhamos conhecimento do modelo de regressão O poder de explicação da relação linear entre x e y a partir do modelo de regressão, para cada yi obervado, em relação ao caso _ anterior (conhecimento apenas dos yi e utilização de y como estimativa) pode ser medido pela _ diferença entre os valores previstos pela regressão ey Definimos como soma dos quadrados devido à regressão, SSR (do inglês sum of squares due to regression), a soma dos quadrados dessas diferenças 2 ( ) SSR = ∑ yˆ i − y 252 Ajuste do modelo de regressão aos dados utilizados Abaixo, a visualização gráfica dessas três diferenças yi − yˆ i 200 yˆ i − y yˆ = 60 + 5 x 150 yi − yi y 100 50 0 5 10 15 20 25 30 253 Ajuste do modelo de regressão aos dados utilizados Embora não seja intuitivo, SSE, SSR e SST estão relacionados da seguinte forma: SST = SSR + SSE O valor de SST é o mesmo independente do grau de ajuste do modelo de regressão Devemos esperar que, quanto melhor o ajuste do modelo de regressão aos dados utilizados, menor a relação SSE/SST e maior a relação SSR/SST No limite, com um ajuste perfeito (a reta de regressão passa exatamente sobre todos os pontos da amostra), teremos SSE = 0 e SST = SSR 254 Ajuste do modelo e regressão aos dados utilizados Definimos o coeficiente de determinação (r2) como: r2 = SSR ∑ ( yˆ i − y ) = SST ∑ ( yi − y ) Quanto mais próximo de 1, melhor o ajuste do modelo de regressão aos dados da amostra. Para o exemplo anterior, SSR = 14.200, SST = 15.730 e r2 = 0.9027 O coeficiente de determinação também pode ser calculado a partir do coeficiente de correlação entre x e y: r2 = (rxy)2 255 Teste de significância dos parâmetros da regressão No modelo de regressão linear simples, a relação de dependência entre y e x é expressa pelo parâmetro β1, que por sua vez é estimado a partir de b1 E como ocorre em qualquer estimação, cometemos um erro ao utilizarmos b1 ao invés de β1 O teste de significância de b1 é feito a partir do intervalo de confiança de b1 para um determinado nível de confiança escolhido Se o intervalo contiver o valor 0, significa que, para o nível de significância escolhido, nós não podemos descartar a hipótese de β1 (o parâmetro desconhecido) ser igual a zero Caso contrário, podemos concluir que, para o nível de significância escolhido, β1 é diferente de zero 256 Teste de significância dos parâmetros da regressão Para definirmos o intervalo de confiança de β1 devemos ter algumas informações sobre a sua distribuição amostral O valor esperado de b1, E(b1), é o próprio parâmetro β1 O desvio-padrão de b1, σb1, pode ser estimado por sb1, que é dado por: sb1 = SSE n−2 2 ( ) ∑ − ∑ xi xi2 A distribuição de b1 é Normal n 257 Teste de significância dos parâmetros da regressão O intervalo de confiança é dado por: b1 ± t α sb1 2 O valor de tα/2 é baseado em uma distribuição t de Student com n – 2 graus de liberdade Para o exemplo anterior, com um nível de significância de 5%, temos tα/2 = 2,3060 e um intervalo de confiança igual a: 5 ± 2,3060 13,83 = 5 ± 1,338 23,83 258 Intervalo de confiança para previsões a partir do modelo de regressão Se o valor obtido para b1 é significativamente diferente de zero, podemos utilizar o modelo de regressão para efetuar previsões da variável dependente y a partir de valores de x Inicialmente veremos como estimar o valor esperado (ou valor médio) de y para um determinado x Esta estimativa nos fornece, por exemplo, o valor esperado de faturamento para todas as lojas com uma determinada população x ao redor O erro associado a esta previsão, para um determinado nível de significância, é dado pelo intervalo de confiança construído em torno deste valor esperado 259 Intervalo de confiança para previsões a partir do modelo de regressão Para x = xp e yp = b0 + b1xp, o intervalo de confiança para um nível de significância α é: yˆ p ± t α s yˆ p 2 s yˆ p 1 =s + n (x p − x )2 2 2 ( ) − x x ∑i ∑i n SSE s= n−2 O valor de tα/2 é baseado em uma distribuição t de Student 260 com n – 2 graus de liberdade Intervalo de confiança para previsões a partir do modelo de regressão No exemplo anterior, para xp = 10, e α = 5%, temos: yˆ p = 110 t α = 2,3060 2 s yˆ p 1 (10 − 14) 2 = 13,83 + = 4,95 10 2528 − (140) 2 10 O que nos fornece o seguinte intervalo de confiança: 110 ± 2,3060.4,95 110 ± 11,415 261 Intervalo de confiança para previsões a partir do modelo de regressão Podemos também utilizar o modelo de regressão para efetuar previsões de um valor individual da variável dependente y a partir de valores de x Essas previsões nos dão uma estimativa de um único ponto y a partir de um determinado x O erro associado a esta previsão, para um determinado nível de significância, é dado pelo intervalo de confiança construído em torno desse valor de y É razoável supor que esse erro seja maior que o do caso anterior (estimativa do valor esperado de y) 262 Intervalo de confiança para previsões a partir do modelo de regressão Para x = xp e^yp = b0 + b1xp, definimos o intervalo de confiança, para um nível de significância α, da seguinte forma: yˆ p ± t α s yˆind 2 sind = s 2 + s 2yˆ p s= 1 = s 1+ + n (x p − x )2 2 2 ( ) x x − ∑i ∑i n SSE n−2 O valor de tα/2 é baseado em uma distribuição t de Student 263 com n – 2 graus de liberdade Intervalo de confiança para previsões a partir do modelo de regressão No exemplo anterior, para xp = 10, e α = 5%, temos: yˆ p = 110 t α = 2,3060 2 s yˆ p 1 (10 − 14) 2 = 14,69 = 13,83 1 + + 10 2528 − (140) 2 10 que nos fornece o seguinte intervalo de confiança: 110 ± 2,3060.14,69 110 ± 33,875 264 Intervalo de confiança para previsões a partir do modelo de regressão Podemos observar graficamente os intervalos para o valor yp esperado de ^ yp e para um valor individual de ^ _ Note que o menor erro é obtido quando xp = x 250 Intervalo de confiança para uma previsão de ^ y 200 Reta de regressão 150 100 Intervalo de confiança para o valor esperado de ^ y 50 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 265 Utilizando a HP-12C e o Excel® A HP-12C pode ser utilizada para calcular os coeficientes da regressão, o coeficiente de determinação e estimativas da variável dependente. Para o exemplo anterior teríamos: Tecla Visor Descrição <f><Σ> 0,00 Limpa os registros estatísticos 58<ENTER>2<Σ+> 1,00 Primeiro dado inserido 105<ENTER>6<Σ+> 2,00 Segundo dado inserido 88<ENTER>8<Σ+> 3,00 Terceiro dado inserido 118<ENTER>9<Σ+> 4,00 Ops! Dado incorreto 118<ENTER>9<Σ-> 3,00 Corrijo o dado incorreto 118<ENTER>8<Σ+> 4,00 Quarto dado inserido 117<ENTER>12<Σ+> 5,00 Quinto dado inserido 137<ENTER>16<Σ+> 6,00 Sexto dado inserido 157<ENTER>20<Σ+> 7,00 Sétimo dado inserido 266 Utilizando a HP-12C e o Excel® Continuação Tecla Visor Descrição 169<ENTER>20<Σ+> 8,00 Oitavo dado inserido 149<ENTER>22<Σ+> 9,00 Nono dado inserido 202<ENTER>26<Σ+> 10,00 Último dado inserido 0<g><y,r><STO>0 60,00 Coeficiente b0 <x y>2<yx> 1<g><y,r><RCL>0<-> 10<g><y,r> 0,9027 Coeficiente de determinação 5,00 Coeficiente b1 110,00 Valor de y para x = 10 267 Utilizando a HP-12C e o Excel® O Excel possui uma ferramenta de análise de regressão No menu Ferramentas selecione Análise de Dados Caso esta opção não esteja disponível, selecione Add-Ins e marque a caixa Ferramentas de Análise Em Análise de Dados, selecione Regressão Forneça as informações necessárias Intervalo dos valores de x Intervalo dos valores de y Nível de significância Intervalo de saída (local na planilha aonde o resultado será268 colocado) Utilizando a HP-12C e o Excel® Para o exemplo anterior temos: SUMMARY OUTPUT Regression Statistics Multiple R 0.950122955 R Square 0.90273363 Adjusted R Square 0.890575334 Standard Error 13.82931669 Observations 10 Coeficiente de determinação b0 b1 Limite inferior do intervalo de confiança ANOVA df Regression Residual Total Intercept X Variable 1 1 8 9 SS 14200 1530 15730 MS 14200 191.25 Coefficients tandard Erro t Stat 60 9.226035 6.503336 5 0.580265 8.616749 F Significance F Limite superior do intervalo 74.24836601 2.54887E-05 de confiança P-value 0.000187444 2.54887E-05 Lower 95% Upper 95% Lower 99.0% 38.72471182 81.27528818 29.04314166 3.661905096 6.338094904 3.05298927 269 Utilizando a HP-12C e o Excel® Para o exemplo anterior temos: SUMMARY OUTPUT Regression Statistics Multiple R 0.950122955 R Square 0.90273363 Adjusted R Square 0.890575334 Standard Error 13.82931669 Observations 10 df Intercept X Variable 1 Limite inferior do intervalo de confiança b0 ANOVA Regression Residual Total Coeficiente de determinação b1 1 8 9 SS 14200 1530 15730 MS 14200 191.25 Coefficients tandard Erro t Stat 60 9.226035 6.503336 5 0.580265 8.616749 F Significance F 74.24836601 2.54887E-05 P-value 0.000187444 2.54887E-05 Limite superior do intervalo de confiança Lower 95% Upper 95% Lower 99.0% 38.72471182 81.27528818 29.04314166 3.661905096 6.338094904 3.05298927 270 Estudo de Caso – Regressão Linear A planilha stat_case3.xls contém as taxas de juros praticadas por todas as instituições financeiras brasileiras em 19/11/1999 nas seguintes modalidades de crédito: 1) Taxa pré fixada para aquisição de bens (denotada por aq_bens) 2) Taxa pré fixada de cheque especial (indicada por ch_espec) 3) Taxa pré-fixada de crédito ao consumidor (denotada por cdc) Queremos saber a relação entre estas taxas, e responder perguntas do tipo: um banco que cobra mais no cheque especial cobra mais também no CDC? Além disso, se um banco não tem produtos numa certa categoria, eu poderia usar a taxa numa outra categoria para tentar “adivinhar” quanto ele estaria cobrando. 271 Estudo de Caso – Regressão Linear Gráfico de CH_ESPEC versus AQ_BENS 14 CITIBANK S.A. 12 SANTANDER BRASIL S.A BCN HSBC SAFRA BRASIL S.A.S.A.SA SUDAMERIS BRASIL S.A BRADESCO AMERICA S.A. BANK DO SUL FRANCES EBANERJ BRASILEIRO S.A. BANCO DO EST. DE GOI ITAÚ S.A. UNIBANCO FICSA S.A. CH_ESPEC 10 CREDIBEL S.A. NOSSA CAIXA-NOSSO BC 8 BANESTES S.A. CACIQUE S.A. MAXINVEST S.A. TRIANGULO S.A. INTERCAP S.A. 6 PROSPER S.A. PANAMERICANO S.A. 4 2 0 0 1 2 3 4 5 AQ_BENS 6 7 8 9 10 272 Estudo de Caso – Regressão Linear Gráfico de CH_ESPEC versus CDC 16 CRUZEIRO DO SUL S.A. 14 CITIBANK S.A. INDUSTRIAL E COMERCI CH_ESPEC 12 PARANA BANCO S.A. MERCANTIL DO S.A. DO SANTANDER BRASIL S.A BANEB BANCO DOBRASIL EST. RS BANDEIRANTES S.A. BANCO DO EST. DE PE REAL BCN S.A. BEMGE S.A. CIDADE S.A. SAFRA S.A.BRASIL BANCO HSBC DESUL BRASILIA BANK BRASIL S. SA S.A. BRADESCO SUDAMERIS S.A AMERICA DO S.A. FRANCES E BANERJ BRASILEIRO S.A. 10 BANCO DO EST. DE GOI MERIDIONAL S.A. UNIBANCO BANKBOSTON BANCO DO EST. DOS.A. PR ITAÚ FICSA S.A. ARAUCARIA S.A. BILBAO VIZCAYA BANCO DOBRASI EST. DOPIA MA BANCO DO EST. DO BANCO DO EST. DO CE BANCO DO EST. DO AM MERCANTIL-FINASA S.A LUSO BRASILEIRO S.A. CREDIBEL S.A. BANESTES S.A. NOSSA CAIXA-NOSSO BC BANCO DOBANESPA BRASIL 8 CAIXA ECONOMICA FEDE BOAVISTA INTERATLANT COOPERATIVO SICREDI BR MERCANTIL S.A. INTERIOR DE SP S.A. MINAS S.A. TRIANGULORURAL S.A. S.A. BANCO DO EST. DE SE S.A. INTERCAP 6 ABN AMRO S.A. BANCO DO EST. DOPROSPER PA S.A. MATONE S.A. BANCO VR S.A. PANAMERICANO S.A. BANCO DA AMAZONIA FICRISA AXELRUD S.A. INTERPART S.A. 4 CACIQUE S.A. 2 0 2 4 6 8 10 CDC 12 14 16 18 273 Estudo de Caso – Regressão Linear Gráfico de CDC versus AQ_BENS 18 CACIQUE S.A. 16 14 CREDITO LLOYDS DE SP S.A. TSB S.A. FICSA S.A. CFI S.A. CREDITEC CDC 12 10 CONTINENTAL S.A. MORADA S.A. INTERMEDIUM - CFI S. BRADESCO C.S.C. SA CFI S.A. FINAUSTRIA CIA DE CR 8 PECUNIA S.A. HSBC BANK BRASIL SA PROSPER S.A. INTERCAP S.A. UNILETRA S/A CFI BBV CFI S.A. 6 UNIBANCO S.ADO CFIEST. PERNAMBUCANAS FINANC ITAÚOMNI S.A. BANCO DE GOI BANERJ S.A.LOCAL MERCANTIL BRASIL FIN AMERICA SUDAMERIS BRASIL S.A SUL S.A. BMG S.A. DO FRANCES E BRASILEIRO GENERAL MOTORS S.A. NOSSA FINANC CAIXA-NOSSO ALFABCN S.A. BC CFI BARIGUI S.A. CFI BB-FINANCEIRA S.A. BANESTES S.A. 4 SAFRA S.A. CITIBANK S.A. S.A. S.A. TRIANGULO FINANSINOS FININVEST S.A. S.A. FINAMAX S.A. CFI PANAMERICANO S.A. RENNER A.J. SANTANDER BRASIL S.A CREDIBEL S.A. BV FINANCEIRA SA CFI 2 0 0 2 4 6 AQ_BENS 8 10 12 274 Estudo de Caso – Regressão Linear Faça no Excel a regressão de CH_ESP versus CDC A equação ajustada é ch_esp = 8.94 - 0.105 cdc Variável Constant cdc S = 2.234 Coeficiente Erro Padrão do Coef. Estatística T 8.9442 0.6546 -0.105 0.1253 R2 =1.2% R2 ajustado = valor-p 13.66 -0.84 0.00 0.41 0.00% Mas, note que o ajuste do modelo é PÉSSIMO, como indicado pelo baixíssimo valor do coeficiente de detreminação R2 (igual a 1.2%). Também, o coeficiente do termo linear não é significante (basta ver a sua estatística t ou o “p-value”), indicando que o modelo poderia ter sido perfeitamente substituído por um modelo constante! Agora volte ao gráfico de CH_ESP versus CDC e tente enxergar por que isso aconteceu... A relação entre as variáveis parece linear? NÂO! 275 Estudo de Caso – Regressão Linear A planilha stat_case2.xls contém as vendas de carros, TV a cores e videocassetes no mercado brasileiroi entre Janeiro de 1995 e Dezembro de 1997. Calcule a matriz de correlação entre as variáveis. Faça o gráfico de vendas de carros versus vendas de TV. Faça o gráfico de vendas de TV versus vendas de videocassetes. Faça o gráfico de vendas de carros versus vendas de videocassetes. Ajuste um modelo de gressão linear simples onde y = vendas de TV e x = vendas de video. 276 Estudo de Caso – Regressão Linear Matriz de correlação carros TV Video carros TV Video 1 0.6524 1 0.6850 0.9495 1 O coeficiente de correlação de uma variável com ela mesma é sempre 1. Por que? Dica: qual a definição do coeficiente de correlação? Note também a alta correlação entre vendas de TV e Video. 277 Estudo de Caso – Regressão Linear Gráfico carros X TV Vendas de Carros (eixo Y) versus Venda de TVs (eixo X) 180,000 160,000 140,000 120,000 100,000 80,000 60,000 300,000 400,000 500,000 600,000 700,000 800,000 900,000 278 Estudo de Caso – Regressão Linear Gráfico TV X Video Vendas de TVs (eixo Y) versus Vendas de Videocassetes (eixo X) 900,000 800,000 700,000 600,000 500,000 400,000 300,000 70,000 120,000 170,000 220,000 270,000 320,000 279 Estudo de Caso – Regressão Linear Gráfico Carros X Video Vendas de Carros (eixo Y) versus Vendas de Videocassetes (eixo X) 180,000 160,000 140,000 120,000 100,000 80,000 60,000 70,000 120,000 170,000 220,000 270,000 320,000 280 Estudo de Caso – Regressão Linear Regressão Linear de TV em Video Estatísticas da Regressão Multiple R 0.9495 <<< é o coef. de correlação R Square 90.1% <<< é o coef. de determinação Adjusted R Square 89.9% Standard Error 45,634 Observations 36 <<< número de pares de observações Coefficients bo b1 126,709.81 2.53 Standard Error 29,167.78 0.14 t Stat 4.34 17.64 P-value 0.01% 0.00% Lower 95% 67,433.78 2.24 Upper 95% 185,985.84 2.82 Note que agora o ajuste da regressão é ÓTIMO, como já esperado, pois o gráfico entre as duas variáveis mostrava uma relação altamente linear. 281 Estudo de Caso – Regressão Linear Regressão Linear de TV em Video Dicas: Quando os coeficientes b0 e b1 são significantes? Em geral, se suas estatísticas t forem maiores que 2, em módulo, podemos afirmar que os coeficientes são diferentes de zero. Também podemos olhar para os intervalos de confiança para b0 e b1 – se estes intervalos NÃO INCLUEM ZERO podemos dizer que os coeficientes são significantes, e é exatamente este o caso que acabamos de mostrar na página anterior! Na próxima página está o gráfico dos valores reais e ajustados (previstos) pela reta de regressão. 282 Estudo de Caso – Regressão Linear Valores Reais e Previstos pela Regressão Relação entre Vendas de Tv e Video e Reta de Regressão Ajustada 900,000 800,000 700,000 TV 600,000 500,000 400,000 300,000 200,000 70,000 120,000 170,000 220,000 270,000 Video TV TV prevista pela regressão 320,000 283 Estudo de Caso – Regressão Linear – Para Casa Considere os dados do arquivo stat_case3.xls contidos na pasta “bancos com todos os produtos”. Você deverá repetir as análises mostradas aqui, e interpretar os resultados – use sua criatividade! Abaixo segue um roteiro mínimo de atividades que você deve desenvolver. a) Faça o gráfico dos 3 pares de taxas. b) Calcule a matriz de correlação entre as 3 variáveis (isto é, as 3 taxas). c) Calcule o máximo, mínimo, média, mediana, moda, percentis 10 e 90% e desvio padrão de cada uma das taxas. d) ajuste um modelo de regressao linear da forma y = a + b.x para relacionar as diversas taxas. 4.1) Faça a regressão de CH_ESPEC em AQ_BENS 4.2) Faça a regressão de CH_ESPEC em CDC 4.3) Faça a regressão de CDC em CH_ESPEC 284 Estudo de Caso – Regressão Linear – Para Casa 4.4) A partir da regressão que você estimou, qual seria a taxa média de cheque especial para um banco que praticasse uma taxa de crédito pessoal de 6% ao mês? 4.5) Faça um gráfico de CH_ESPEC versus CDC superpondo a ele a reta estimada para a regressão. Você vai ver que a reta estimada pela regressão está passando pelo "meio" da nuvem de pontos (CDC,CH_ESPEC). e) Neste item você vai precisar instalar o add-in “ferramentas de análise” do Excel e usar o módulo de regressão dentro destas ferramentas. O objetivo é fazer a regressão da taxa CH_ESPEC (cheque especial) nas taxas AQ_BENS e CDC. 285 Estudo de Caso – Regressão Linear – Para Casa Ou seja, você procura ajustar a seguinte equação: CH_ESPEC = a + b*AQ_BENS + c*CDC Responda a seguinte pergunta a partir da equação ajustada acima: se AQ_BENS é 4% a.m, CDC é 7% a.m, qual o valor de CH_ESPEC? 286 Nota – Instalação das Ferramentas de Análise do Excel Muitas das técnicas descritas aqui requerem a prévia instalação do suplemento (“add-in”) “Ferramentas de Análise” do Excel. O procedimento de instalação é descrito a seguir: No menu Ferramentas, selecione “Suplementos” e na caixa de diálogo que será aberta marque a opção “Ferramentas de análise”. Se esta opção não estiver presente, clique “procurar” para encontrar o arquivo correspondente (em geral chamado Analys32.xll) ou rode novamente o “set-up” do MS-Office. 287