Faculdade de Economia, Universidade Nova de Lisboa Tratamento de Dados André C. Silva Questões de Exames Passados 1. Considere o polígono integral das distribuições a seguir e responda as perguntas abaixo. F(x) 1 A B 0.5 C 0 20 D 40 60 80 100 x a. Qual distribuição possui a maior média? Justifique. b. Obtenha os 3 primeiros quartis da distribuição B. 2. Escreva V (verdadeiro) ou F (falso) para cada questão. Justifique. (Nota: no exame não foi pedido a justificação, no entanto duas respostas erradas anulavam uma certa.) Se a ordem dos dados é alterada, então os coeficientes da regressão linear se alteram. Mesmo quando o coeficiente de correlação linear entre duas variáveis é não nulo, não podemos dizer que existe uma relação causal unilateral ou bilateral entre elas. Um inquérito efectuado a 20 regiões do país A revelou um valor médio de exportações mensais de 5 u.m. e uma variância de 15 u.m. Por sua vez, um inquérito realizado a 10 regiões do país B revelou uma média de exportações mensais de 8 u.m. e uma variância de 12 u.m. Assim sendo, a média e a variância das exportações mensais dos dois países são: média = 6 e variância = 14. Numa distribuição simétrica, observamos que: Q1 / 4 = Mediana − Q3 / 4 2 Se duas amostras possuem a mesma média e desvio-padrão e, além disso, forem ambas simétricas, então elas terão também o mesmo índice de kurtosis. 1 Se obtivermos duas variáveis estandardizadas K e W a partir de duas variáveis originais A e B, podemos afirmar em relação ao coeficiente de correlação linear (R) que: RK,W = RA,B. 3. Um número recente do Journal of Financial Econometrics trouxe um artigo com o seguinte título: “A Test for Symmetry with Leptokurtic Financial Data”. De que se trata o artigo? Explique. 4. Considere a seguinte relação entre preços e quantidades: q = Ap-b. Suponha que você tenha dados de preços e quantidades (qi, pi). Como você estimaria os valores de A e b? 5. O retorno (bruto) de um activo entre t e t+1 é dado por Rt = Pt+1/Pt, onde Pt é o preço no período t. Considere os preços em quatro períodos: P1, P2, P3 e P4. a. Prove que o retorno médio entre os períodos 1 e 4, isto é, R = (P4/P1)1/3, é igual a média geométrica entre os retornos em cada período 1, 2 e 3. b. Prove que o logaritmo do retorno médio entre os períodos 1 e 4 é igual a média aritmética dos logaritmos dos retornos em cada período. 6. O que significa dizer que determinada observação está no percentil 99? 7. Um investigador possui dados sobre as vendas de sapatos em diversas cidades. Ele faz a seguinte regressão: yi = a + bxi + ei, onde yi e xi referem-se a vendas de sapatos do pé esquerdo e do pé direito respectivamente, e i refere-se a cada cidade. a. Que valor ele deve encontrar para os coeficientes a e b? Explique. b. Que valor ele deve encontrar para o R2? O valor do R2 é convincente para indicar a qualidade da regressão neste caso? Comente. 8. Um investidor possui dados sobre os retornos de uma acção nos dez últimos anos. Ele quer saber se os retornos possuem uma distribuição próxima da Normal. Como ele deve proceder? 9. Um analista desconfia da existência de tendência e de sazonalidade nas vendas de um sector. Com a posse de dados para vendas em cada estação do ano (em milhares de Euros), ele fez uma regressão das vendas no tempo e em três variáveis Dummy, E1, E2, E3, para a Primavera, Verão, e Outono respectivamente. A regressão feita pelo analista, com os coeficientes encontrados, foi a seguinte: 2 xt = 100 + 0,5t – 2E1t – 10E2t – 0,01E3t + et Interprete os resultados. Qual deve ser a conclusão do analista? 10. Qual o sentido de se falar em desvio-padrão de uma estimativa? 11. Abaixo há dois histogramas sobre o intervalo de tempo entre transacções bancárias. As amostras possuem o mesmo número de pessoas. Quanto maior a inflação, espera-se um intervalo de tempo menor para cada indivíduo. Com essa informação, qual histograma revela a situação com inflação mais alta? Justifique. Eixos dos histogramas: Número de Pessoas × dias. 350 300 350 A 300 250 250 200 200 150 150 100 100 50 50 0 180 185 190 195 dias 200 205 210 0 179.5 B 180 180.5 181 181.5 182 dias 182.5 183 183.5 184 184.5 12. Um problema para o cálculo do índice de preços é quanto à periodicidade da recolha dos preços. Como você decidiria se um preço deve ser recolhido quinzenalmente, mensalmente ou anualmente? Seria interessante recolher todos os preços quinzenalmente? Justifique. 13. Dois bancos de investimento querem fazer um estudo sobre o poder de compra de uma população de 2000 a 2005. O primeiro tem acesso a uma série do nível de preços com base em 1950. O segundo, com base em 1990. Os dois bancos reescrevem as séries de modo a fazer o preço igual a 100 para o ano 2000. a. As duas novas séries são equivalentes? Justifique. b. Qual a melhor série para fazer o estudo? Justifique. 3 14. Considere os seguintes dados classificados referentes à distribuição dos indivíduos pertencentes a uma amostra, segundo o respectivo salário auferido. Salário ]0; 25] ]25; 50] ]50; 75] ]75; 100] ]100; 125] ]125; 150] Frequências Absolutas 50 85 a b 10 5 a) Complete a tabela sabendo que 32,5% dos indivíduos recebem mais de 50 u.m. e que 75% recebem menos de 62,5 u.m. b) Represente graficamente o histograma de área 1 e o polígono de frequências. c) Calcule a média, a mediana e a moda da distribuição apresentada. Com estes valores, o que pode concluir acerca da distribuição? d) Obtenha a curva de Lorenz. O que pode dizer sobre a concentração dos salários nesta amostra? e) Os Sindicatos encontram-se neste momento a discutir os aumentos salariais para o próximo ano. As propostas em votação são: aumentar cada salário em 3,8 u.m. ou em 5%. i. Qual das políticas implica o menor aumento da massa salarial? Justifique. ii. Qual a implicação de cada política na concentração do rendimento? Não quantifique, explique apenas o sentido da variação. 15. De uma amostra de 10 empresas no sector de vestuário, recolheu-se informação relativa a duas variáveis: Qi = produção anual de vestuário (em milhares de peças) e Ki = equipamentos de produção (em u.m.). ∑ Ki = 75 ∑ Qi = 175 ∑ KiQi = 1441 ∑ Ki 2 = 645 ∑ Qi 2 = 3289 a) (2 pontos) Face às variáveis apresentadas estime a equação da recta de regressão linear apropriada ao estudo. Interprete os parâmetros obtidos. b) (2 pontos) O que pode concluir em relação à qualidade de ajustamento? Justifique. c) (1 ponto) Qual o nível de produção anual previsto para uma empresa que possui 10 u.m. em equipamentos de produção? 4 16. Considere os seguintes resultados de um inquérito de famílias sobre as despesas em bens alimentares relativas aos anos 2002, 2003 e 2004. Leite Queijo Iogurte 2002 8.000 2.500 5.000 2003 8.500 3.000 5.500 2004 9.000 3.500 6.000 A tabela seguinte sintetiza os índices de preços dos respectivos bens alimentares: 2002 2003 2004 Índice de Preços do Leite (Base 2002) 1 1,2 1,4 Índice de Preços do Queijo (Base 2003) 0,8 1 1,3 Índice de Preços do Iogurte (Base 2004) 0,7 0,8 1 a. Determine o índice de preços de Laspeyres para 2004 com base em 2003 para sintetizar a evolução dos preços dos três bens. b. Calcule um índice de valor para 2003 com base em 2002 para o conjunto dos três cabazes. 17. Um agricultor decidiu encomendar a um aluno de Tratamento de Dados um estudo para relacionar a quantidade de morangos produzida anualmente com a quantidade de fertilizantes utilizada. Os dados disponíveis dos últimos sete anos são os seguintes Qi (Produção de Morangos, toneladas) 60 80 90 100 110 120 150 Fi (Utilização de Fertilizantes, gramas) 260 280 280 300 350 425 600 a. Calcule os coeficientes da regressão de Qi sobre Fi. Interprete os coeficientes obtidos. b. Se a utilização de fertilizantes for de 500 gramas, qual a produção de morangos que você espera obter? c. Calcule o coeficiente de correlação linear entre as duas variáveis. Interprete. d. Você pensa também em utilizar um modelo exponencial entre as duas variáveis, Qi = ABFi. Como você estimaria os coeficientes A e B? Explique o procedimento, não é preciso calcular os coeficientes. 5 e. O agricultor quer saber se a utilização de fertilizantes causa o aumento da produção de morangos, ou se o aumento da produção de morangos é a causa do aumento da utilização de fertilizantes. i. O seu estudo é capaz de chegar a essa resposta? Explique. ii. O agricultor pergunta de que dados você precisaria para chegar a uma conclusão. O que você responde? Explique. 18. Considere os seguintes dados: Período 2000 2001 2002 Despesa Corrente EUR 7.000 EUR 7.200 EUR 7.400 Bem A Paasche Quantidade Base 2002 1,135 1,061 1,000 Despesa Corrente EUR 3.000 EUR 4.000 EUR 5.000 Bem B Paasche Quantidade Base 2002 0,660 0,838 1,000 a. Com os dados para a despesa, construa um índice de valor para cada um dos bens, para os anos 2000, 2001 e 2002, com base no ano 2000. b. Calcule o índice de preços de Laspeyres para cada um dos bens, para os anos 2000, 2001 e 2002, com base no ano 2000. A inflação foi maior para qual bem? c. Calcule o índice de Laspeyres para o conjunto dos dois bens para 2000, 2001 e 2002, com base no ano 2000. Qual o aumento do custo de vida entre 2000 e 2002, segundo este índice? 19. Um país registou ao longo dos últimos 3 anos as seguintes importações Quadrimestrais no sector automóvel (em milhões de Euros). Período 2002, 1º Quad 2002, 2º Quad 2002, 3º Quad 2003, 1º Quad 2003, 2º Quad 2003, 3º Quad 2004, 1º Quad 2004, 2º Quad 2004, 3º Quad Importações 3,0 3,5 5,0 4,0 5,5 6,0 5,0 6,5 8,0 a. Estime a tendência pelo método dos mínimos quadrados. Sugestão: para cada ano, tome como valor a média das importações dos 3 respectivos Quadrimestres. b. Obtenha os índices de sazonalidade. Admita o modelo multiplicativo. 6 c. A previsão das exportações de automóveis em 2005 é de 28 milhões de Euros. Apresente uma previsão para o saldo da balança comercial no sector automóvel em 2005. 20. Um banco de dados possui informação sobre o rendimento e a idade de cada pessoa em uma amostra representativa de uma população. Um artigo recente no Journal of Monetary Economics apresentou os seguintes gráficos obtidos com este banco de dados: Média/Mediana Coeficiente de Gini Idade Idade O que você pode concluir sobre a população com estes gráficos? Explique. 21. Um economista foi contratado para fazer um estudo sobre a adopção de uma nova tecnologia. Ele possui dados com a proporção de empresas que adoptaram a tecnologia ao longo do tempo. Ele pensa em fazer a seguinte regressão: logyt = a + bt + et. Esta é uma boa forma de analisar o problema? Explique. 22. No ano 2004 a despesa efectuada com os produtos A, B e C atingiu os seguintes valores: Despesa do produto A 1500 Euros Despesa do produto B 2400 Euros Despesa do produto C 2100 Euros O índice de preços de Laspeyres de 2005 com base em 2004 foi igual a 1,4. Os índices de preços dos produtos B e C nessa mesma base foram 1,6 e 1,3 respectivamente. Com essas informações, qual o índice de preços do produto A? 7 23. O índice de preços de Laspeyres é reversível no tempo? Justifique. Como a sua resposta se relaciona com o facto das quantidades variarem com o tempo? 24. Qual é a correlação entre a temperatura e o número de pessoas com sobretudos em uma cidade? Explique. 25. A empresa LASERM produz apenas um tipo de máquina de corte por laser e vende para o mercado Português e Espanhol. A seguinte série descreve as vendas em milhares de Euros deste tipo de máquina, nos últimos 5 anos, para o mercado Português: Ano Semestre Xt 1999 1 12 2 20 1 16 2 22 1 18 2 26 1 20 2 32 1 22 2 38 2000 2001 2002 2003 a. Estime a tendência, Tt = a + bt’, das vendas para o mercado Português pelo método dos mínimos quadrados. Interprete. b. Com a resposta do item a, escreva a estimativa da tendência para cada período. Nota: na sua folha de respostas reproduza a tabela acima e adicione uma coluna para a tendência. c. Determine os índices de sazonalidade. Admita o modelo multiplicativo e faça a correcção do índice. Interprete os valores obtidos. Com base nos registos das vendas semestrais para o mercado Espanhol, em igual período, obteve-se a seguinte recta dos mínimos quadrados: Tt = 20 + 4t’. Sabe-se ainda que os índices de sazonalidade, obtidos com o modelo multiplicativo, são 0.893 e 1.107 respectivamente para o 1º e 2º semestres. d. Faça uma previsão do total de vendas da LASERM para os dois mercados para o primeiro semestre de 2004. 8 26. Uma empresa contratou um aluno de Tratamento de Dados para fazer um estudo sobre as suas condições de trabalho. O aluno recolheu a seguinte amostra sobre os salários da empresa: 701 761 777 803 811 820 834 855 879 902 934 934 937 1026 1045 1093 1203 1222 1254 1396 A amostra contém 20 observações e está com os valores ordenados. Com esta amostra, faça uma análise da estrutura salarial desta empresa da forma mais detalhada possível. Utilize o que aprendeu em Tratamento de Dados. Calcule as medidas relevantes, faça gráficos e interprete. Sugestão: ao organizar os dados em classes, utilize 5 classes. Caracterize a distribuição da melhor forma quanto à localização, dispersão, assimetria etc. Pense nas medidas e gráficos mais importantes. 27. Um agente imobiliário quer fazer um estudo sobre o efeito da área de um imóvel sobre o seu valor de arrendamento. Ele possui um banco de dados com o valor da renda e a área de imóveis em Lisboa e no Porto. Os imóveis possuem as mesmas características, com excepção da área e da cidade onde estão localizados. O agente imobiliário faz a seguinte regressão yi = a + bxi + ei, onde yi representa o valor da renda e xi a área do imóvel. a. Segundo esta regressão, qual é a interpretação dos coeficientes a e b? Esta regressão deve gerar um coeficiente de b enviesado? Explique. b. Como você poderia corrigir a regressão? Explique. 28. Uma variável pode assumir apenas valores positivos. A maior parte dos valores costuma estar próximo de 1. Porém, em algumas situações, a variável assume valores muito maiores do que 1. Desenhe um histograma típico de tal distribuição. Qual deve ser a moda da distribuição? Como devem se relacionar a média, a mediana e a moda desta distribuição? São iguais? Será possível ordená-los? Escreva no histograma a posição da média, da mediana e da moda. 9 29. Um consultor fez duas regressões com as variáveis y, x, z e outras variáveis. Ele usou dois bancos de dados diferentes. Os coeficientes encontrados foram os seguintes: (A) yi = 3 + 0.5xi + 2zi + (outras variáveis) + ei (0.2) (0.8) (1.2) TSS = 2300, SSE = 580 (B) yi = 3 + 0.5xi + 2zi + (outras variáveis) + ei (0.5) (0.1) (0.8) TSS = 2800, SSE = 400 Os valores em parênteses são os desvios-padrão dos coeficientes. TSS é igual a 2 ∑ i ( yi − y ) e SSE é a soma dos quadrados dos erros ei. a. (1 pt) Em qual regressão há uma evidência mais forte do coeficiente relativo a x ser diferente de zero? Explique. b. (1 pt) Calcule o R2 das duas regressões. De acordo com o R2, qual regressão possui um melhor ajuste? Explique. 30. Uma variável possui o seguinte comportamento: yt = a + bt + et, onde et é um ruído sem tendência. Com o uso do operador diferença, mostre que a nova variável definida por xt = ∆yt não possui tendência. Qual deve ser a média de xt? 31. Uma pessoa desconfia que as vendas da sua empresa estão sujeitas à sazonalidade. Ela quer obter a sazonalidade com o uso de uma variável Dummy para o 2º Semestre. Os dados disponíveis de vendas são os seguintes, com início no 1º semestre de 2001, em milhares de Euros: Ano Vendas Ano Vendas 2001 1º Sem 100 2004 1º Sem 102 2001 2º Sem 122 2004 2º Sem 119 2002 1º Sem 98 2005 1º Sem 104 2002 2º Sem 124 2005 2º Sem 120 2003 1º Sem 105 2003 2º Sem 118 a. Com uma regressão yt = a + bxt + et, onde yt representa as vendas no período e xt é uma variável Dummy para o segundo semestre, obtenha os coeficientes a e b. Nota: a média das vendas em todos os anos acima é igual a 111,20, e a soma das vendas no segundo semestre é igual a 603. b. Interprete os valores encontrados no item a. Existe um componente sazonal nas vendas deste produto? Explique. 10 32. Considere a seguinte informação sobre as importações de um produto e sobre um índice de preços: Ano 1999 2000 2001 2002 2003 2004 2005 Importações a Preços Correntes (mil Euros) 920 950 1.000 1.080 1.160 1.350 1.450 Índice de Preços Base 1999 1,000 1,090 1,140 1,200 1,250 Índice de Preços Base 2003 1,000 1,050 1,100 a. Na sua folha de respostas, complete os valores em falta relativos à evolução do índice de preços com base em 1999 e em 2003. b. Calcule o valor das importações, em termos reais, a preços de 2003. c. Calcule um índice de importações deste produto, a preços de 2003, com base em 1999. d. Segundo este índice, qual foi o aumento das importações deste produto em termos reais de 1999 a 2005? 33. Um estudo sobre o efeito da variação da qualidade no índice de preços para Portugal chegou às seguintes conclusões. (1) Em 1993, o IPC dos automóveis foi enviesado 5,2 pontos percentuais devido a alterações de qualidade. (2) Este enviesamento teve um impacto de 0,3 pontos percentuais no IPC total. Explique o problema em questão e os resultados. 34. Um modelo relaciona produção (Y), capital (K) e trabalho (L) de acordo com a relação Y = AK1/3L2/3. Um consultor possui dados sobre a produção por trabalhador (Y/L) e capital por trabalhador (K/L) para uma região. Ele faz a regressão yi = a + bxi + ei, onde yi = log(Yi/Li) e xi = log(Ki/Li). a. Que valor ele deve obter para b para dar suporte ao modelo? Explique. 11 b. De ∑ (x acordo com os dados disponíveis, temos x = 4.562 , y = 2.239 , − x ) = 0.1630 , ∑ ( yi − y ) = 0.02628 e ∑ ( xi − x )( yi − y ) = 0.05286 . Obtenha os valores de a e b da regressão acima. Interprete. 2 2 i c. Estes valores dão suporte ao modelo? Explique. 12