Faculdade de Economia, Universidade Nova de Lisboa
Tratamento de Dados
André C. Silva
Questões de Exames Passados
1. Considere o polígono integral das distribuições a seguir e responda as perguntas
abaixo.
F(x)
1
A
B
0.5
C
0
20
D
40
60
80
100
x
a. Qual distribuição possui a maior média? Justifique.
b. Obtenha os 3 primeiros quartis da distribuição B.
2. Escreva V (verdadeiro) ou F (falso) para cada questão. Justifique. (Nota: no exame
não foi pedido a justificação, no entanto duas respostas erradas anulavam uma certa.)
Se a ordem dos dados é alterada, então os coeficientes da regressão linear se
alteram.
Mesmo quando o coeficiente de correlação linear entre duas variáveis é não
nulo, não podemos dizer que existe uma relação causal unilateral ou bilateral
entre elas.
Um inquérito efectuado a 20 regiões do país A revelou um valor médio de
exportações mensais de 5 u.m. e uma variância de 15 u.m. Por sua vez, um
inquérito realizado a 10 regiões do país B revelou uma média de exportações
mensais de 8 u.m. e uma variância de 12 u.m.
Assim sendo, a média e a variância das exportações mensais dos dois países são:
média = 6 e variância = 14.
Numa distribuição simétrica, observamos que: Q1 / 4 =
Mediana − Q3 / 4
2
Se duas amostras possuem a mesma média e desvio-padrão e, além disso, forem
ambas simétricas, então elas terão também o mesmo índice de kurtosis.
1
Se obtivermos duas variáveis estandardizadas K e W a partir de duas variáveis
originais A e B, podemos afirmar em relação ao coeficiente de correlação linear
(R) que: RK,W = RA,B.
3. Um número recente do Journal of Financial Econometrics trouxe um artigo com o
seguinte título: “A Test for Symmetry with Leptokurtic Financial Data”. De que se trata
o artigo? Explique.
4. Considere a seguinte relação entre preços e quantidades: q = Ap-b. Suponha que você
tenha dados de preços e quantidades (qi, pi). Como você estimaria os valores de A e b?
5. O retorno (bruto) de um activo entre t e t+1 é dado por Rt = Pt+1/Pt, onde Pt é o preço
no período t. Considere os preços em quatro períodos: P1, P2, P3 e P4.
a. Prove que o retorno médio entre os períodos 1 e 4, isto é, R = (P4/P1)1/3, é igual a
média geométrica entre os retornos em cada período 1, 2 e 3.
b. Prove que o logaritmo do retorno médio entre os períodos 1 e 4 é igual a média
aritmética dos logaritmos dos retornos em cada período.
6. O que significa dizer que determinada observação está no percentil 99?
7. Um investigador possui dados sobre as vendas de sapatos em diversas cidades. Ele
faz a seguinte regressão:
yi = a + bxi + ei,
onde yi e xi referem-se a vendas de sapatos do pé esquerdo e do pé direito
respectivamente, e i refere-se a cada cidade.
a. Que valor ele deve encontrar para os coeficientes a e b? Explique.
b. Que valor ele deve encontrar para o R2? O valor do R2 é convincente para indicar a
qualidade da regressão neste caso? Comente.
8. Um investidor possui dados sobre os retornos de uma acção nos dez últimos anos. Ele
quer saber se os retornos possuem uma distribuição próxima da Normal. Como ele deve
proceder?
9. Um analista desconfia da existência de tendência e de sazonalidade nas vendas de um
sector. Com a posse de dados para vendas em cada estação do ano (em milhares de
Euros), ele fez uma regressão das vendas no tempo e em três variáveis Dummy, E1, E2,
E3, para a Primavera, Verão, e Outono respectivamente.
A regressão feita pelo analista, com os coeficientes encontrados, foi a seguinte:
2
xt = 100 + 0,5t – 2E1t – 10E2t – 0,01E3t + et
Interprete os resultados. Qual deve ser a conclusão do analista?
10. Qual o sentido de se falar em desvio-padrão de uma estimativa?
11. Abaixo há dois histogramas sobre o intervalo de tempo entre transacções bancárias.
As amostras possuem o mesmo número de pessoas. Quanto maior a inflação, espera-se
um intervalo de tempo menor para cada indivíduo. Com essa informação, qual
histograma revela a situação com inflação mais alta? Justifique.
Eixos dos histogramas: Número de Pessoas × dias.
350
300
350
A
300
250
250
200
200
150
150
100
100
50
50
0
180
185
190
195
dias
200
205
210
0
179.5
B
180
180.5
181
181.5
182
dias
182.5
183
183.5
184
184.5
12. Um problema para o cálculo do índice de preços é quanto à periodicidade da recolha
dos preços. Como você decidiria se um preço deve ser recolhido quinzenalmente,
mensalmente ou anualmente? Seria interessante recolher todos os preços
quinzenalmente? Justifique.
13. Dois bancos de investimento querem fazer um estudo sobre o poder de compra de
uma população de 2000 a 2005. O primeiro tem acesso a uma série do nível de preços
com base em 1950. O segundo, com base em 1990. Os dois bancos reescrevem as séries
de modo a fazer o preço igual a 100 para o ano 2000.
a. As duas novas séries são equivalentes? Justifique.
b. Qual a melhor série para fazer o estudo? Justifique.
3
14. Considere os seguintes dados classificados referentes à distribuição dos indivíduos
pertencentes a uma amostra, segundo o respectivo salário auferido.
Salário
]0; 25]
]25; 50]
]50; 75]
]75; 100]
]100; 125]
]125; 150]
Frequências Absolutas
50
85
a
b
10
5
a) Complete a tabela sabendo que 32,5% dos indivíduos recebem mais de 50 u.m. e
que 75% recebem menos de 62,5 u.m.
b) Represente graficamente o histograma de área 1 e o polígono de frequências.
c) Calcule a média, a mediana e a moda da distribuição apresentada. Com estes
valores, o que pode concluir acerca da distribuição?
d) Obtenha a curva de Lorenz. O que pode dizer sobre a concentração dos salários
nesta amostra?
e) Os Sindicatos encontram-se neste momento a discutir os aumentos salariais para
o próximo ano. As propostas em votação são: aumentar cada salário em 3,8 u.m.
ou em 5%.
i. Qual das políticas implica o menor aumento da massa salarial? Justifique.
ii. Qual a implicação de cada política na concentração do rendimento? Não
quantifique, explique apenas o sentido da variação.
15. De uma amostra de 10 empresas no sector de vestuário, recolheu-se informação
relativa a duas variáveis: Qi = produção anual de vestuário (em milhares de peças) e Ki
= equipamentos de produção (em u.m.).
∑ Ki = 75
∑ Qi = 175
∑ KiQi = 1441
∑ Ki
2
= 645
∑ Qi
2
= 3289
a) (2 pontos) Face às variáveis apresentadas estime a equação da recta de regressão
linear apropriada ao estudo. Interprete os parâmetros obtidos.
b) (2 pontos) O que pode concluir em relação à qualidade de ajustamento?
Justifique.
c) (1 ponto) Qual o nível de produção anual previsto para uma empresa que possui
10 u.m. em equipamentos de produção?
4
16. Considere os seguintes resultados de um inquérito de famílias sobre as despesas em
bens alimentares relativas aos anos 2002, 2003 e 2004.
Leite
Queijo
Iogurte
2002
8.000
2.500
5.000
2003
8.500
3.000
5.500
2004
9.000
3.500
6.000
A tabela seguinte sintetiza os índices de preços dos respectivos bens alimentares:
2002
2003
2004
Índice de Preços do
Leite (Base 2002)
1
1,2
1,4
Índice de Preços do
Queijo (Base 2003)
0,8
1
1,3
Índice de Preços do
Iogurte (Base 2004)
0,7
0,8
1
a. Determine o índice de preços de Laspeyres para 2004 com base em 2003 para
sintetizar a evolução dos preços dos três bens.
b. Calcule um índice de valor para 2003 com base em 2002 para o conjunto dos três
cabazes.
17. Um agricultor decidiu encomendar a um aluno de Tratamento de Dados um estudo
para relacionar a quantidade de morangos produzida anualmente com a quantidade de
fertilizantes utilizada. Os dados disponíveis dos últimos sete anos são os seguintes
Qi (Produção de Morangos, toneladas)
60
80
90
100
110
120
150
Fi (Utilização de Fertilizantes, gramas)
260
280
280
300
350
425
600
a. Calcule os coeficientes da regressão de Qi sobre Fi. Interprete os coeficientes obtidos.
b. Se a utilização de fertilizantes for de 500 gramas, qual a produção de morangos que
você espera obter?
c. Calcule o coeficiente de correlação linear entre as duas variáveis. Interprete.
d. Você pensa também em utilizar um modelo exponencial entre as duas variáveis, Qi =
ABFi. Como você estimaria os coeficientes A e B? Explique o procedimento, não é
preciso calcular os coeficientes.
5
e. O agricultor quer saber se a utilização de fertilizantes causa o aumento da produção
de morangos, ou se o aumento da produção de morangos é a causa do aumento da
utilização de fertilizantes.
i. O seu estudo é capaz de chegar a essa resposta? Explique.
ii. O agricultor pergunta de que dados você precisaria para chegar a uma
conclusão. O que você responde? Explique.
18. Considere os seguintes dados:
Período
2000
2001
2002
Despesa
Corrente
EUR 7.000
EUR 7.200
EUR 7.400
Bem A
Paasche Quantidade
Base 2002
1,135
1,061
1,000
Despesa
Corrente
EUR 3.000
EUR 4.000
EUR 5.000
Bem B
Paasche Quantidade
Base 2002
0,660
0,838
1,000
a. Com os dados para a despesa, construa um índice de valor para cada um dos bens,
para os anos 2000, 2001 e 2002, com base no ano 2000.
b. Calcule o índice de preços de Laspeyres para cada um dos bens, para os anos 2000,
2001 e 2002, com base no ano 2000. A inflação foi maior para qual bem?
c. Calcule o índice de Laspeyres para o conjunto dos dois bens para 2000, 2001 e 2002,
com base no ano 2000. Qual o aumento do custo de vida entre 2000 e 2002, segundo
este índice?
19. Um país registou ao longo dos últimos 3 anos as seguintes importações
Quadrimestrais no sector automóvel (em milhões de Euros).
Período
2002, 1º Quad
2002, 2º Quad
2002, 3º Quad
2003, 1º Quad
2003, 2º Quad
2003, 3º Quad
2004, 1º Quad
2004, 2º Quad
2004, 3º Quad
Importações
3,0
3,5
5,0
4,0
5,5
6,0
5,0
6,5
8,0
a. Estime a tendência pelo método dos mínimos quadrados. Sugestão: para cada ano,
tome como valor a média das importações dos 3 respectivos Quadrimestres.
b. Obtenha os índices de sazonalidade. Admita o modelo multiplicativo.
6
c. A previsão das exportações de automóveis em 2005 é de 28 milhões de Euros.
Apresente uma previsão para o saldo da balança comercial no sector automóvel em
2005.
20. Um banco de dados possui informação sobre o rendimento e a idade de cada pessoa
em uma amostra representativa de uma população. Um artigo recente no Journal of
Monetary Economics apresentou os seguintes gráficos obtidos com este banco de dados:
Média/Mediana
Coeficiente de Gini
Idade
Idade
O que você pode concluir sobre a população com estes gráficos? Explique.
21. Um economista foi contratado para fazer um estudo sobre a adopção de uma nova
tecnologia. Ele possui dados com a proporção de empresas que adoptaram a tecnologia
ao longo do tempo. Ele pensa em fazer a seguinte regressão:
logyt = a + bt + et.
Esta é uma boa forma de analisar o problema? Explique.
22. No ano 2004 a despesa efectuada com os produtos A, B e C atingiu os seguintes
valores:
Despesa do produto A
1500 Euros
Despesa do produto B
2400 Euros
Despesa do produto C
2100 Euros
O índice de preços de Laspeyres de 2005 com base em 2004 foi igual a 1,4.
Os índices de preços dos produtos B e C nessa mesma base foram 1,6 e 1,3
respectivamente.
Com essas informações, qual o índice de preços do produto A?
7
23. O índice de preços de Laspeyres é reversível no tempo? Justifique. Como a sua
resposta se relaciona com o facto das quantidades variarem com o tempo?
24. Qual é a correlação entre a temperatura e o número de pessoas com sobretudos em
uma cidade? Explique.
25. A empresa LASERM produz apenas um tipo de máquina de corte por laser e vende
para o mercado Português e Espanhol. A seguinte série descreve as vendas em milhares
de Euros deste tipo de máquina, nos últimos 5 anos, para o mercado Português:
Ano
Semestre
Xt
1999
1
12
2
20
1
16
2
22
1
18
2
26
1
20
2
32
1
22
2
38
2000
2001
2002
2003
a. Estime a tendência, Tt = a + bt’, das vendas para o mercado Português pelo método
dos mínimos quadrados. Interprete.
b. Com a resposta do item a, escreva a estimativa da tendência para cada período. Nota:
na sua folha de respostas reproduza a tabela acima e adicione uma coluna para a
tendência.
c. Determine os índices de sazonalidade. Admita o modelo multiplicativo e faça a
correcção do índice. Interprete os valores obtidos.
Com base nos registos das vendas semestrais para o mercado Espanhol, em igual
período, obteve-se a seguinte recta dos mínimos quadrados: Tt = 20 + 4t’.
Sabe-se ainda que os índices de sazonalidade, obtidos com o modelo multiplicativo, são
0.893 e 1.107 respectivamente para o 1º e 2º semestres.
d. Faça uma previsão do total de vendas da LASERM para os dois mercados para o
primeiro semestre de 2004.
8
26. Uma empresa contratou um aluno de Tratamento de Dados para fazer um estudo
sobre as suas condições de trabalho. O aluno recolheu a seguinte amostra sobre os
salários da empresa:
701
761
777
803
811
820
834
855
879
902
934
934
937
1026
1045
1093
1203
1222
1254
1396
A amostra contém 20 observações e está com os valores ordenados.
Com esta amostra, faça uma análise da estrutura salarial desta empresa da forma mais
detalhada possível. Utilize o que aprendeu em Tratamento de Dados. Calcule as
medidas relevantes, faça gráficos e interprete.
Sugestão: ao organizar os dados em classes, utilize 5 classes. Caracterize a distribuição
da melhor forma quanto à localização, dispersão, assimetria etc. Pense nas medidas e
gráficos mais importantes.
27. Um agente imobiliário quer fazer um estudo sobre o efeito da área de um imóvel
sobre o seu valor de arrendamento. Ele possui um banco de dados com o valor da renda
e a área de imóveis em Lisboa e no Porto. Os imóveis possuem as mesmas
características, com excepção da área e da cidade onde estão localizados.
O agente imobiliário faz a seguinte regressão yi = a + bxi + ei, onde yi representa o valor
da renda e xi a área do imóvel.
a. Segundo esta regressão, qual é a interpretação dos coeficientes a e b? Esta regressão
deve gerar um coeficiente de b enviesado? Explique.
b. Como você poderia corrigir a regressão? Explique.
28. Uma variável pode assumir apenas valores positivos. A maior parte dos valores
costuma estar próximo de 1. Porém, em algumas situações, a variável assume valores
muito maiores do que 1.
Desenhe um histograma típico de tal distribuição. Qual deve ser a moda da distribuição?
Como devem se relacionar a média, a mediana e a moda desta distribuição? São iguais?
Será possível ordená-los? Escreva no histograma a posição da média, da mediana e da
moda.
9
29. Um consultor fez duas regressões com as variáveis y, x, z e outras variáveis. Ele
usou dois bancos de dados diferentes. Os coeficientes encontrados foram os seguintes:
(A)
yi = 3 + 0.5xi + 2zi + (outras variáveis) + ei
(0.2) (0.8) (1.2)
TSS = 2300, SSE = 580
(B)
yi = 3 + 0.5xi + 2zi + (outras variáveis) + ei
(0.5) (0.1) (0.8)
TSS = 2800, SSE = 400
Os valores em parênteses são os desvios-padrão dos coeficientes. TSS é igual a
2
∑ i ( yi − y ) e SSE é a soma dos quadrados dos erros ei.
a. (1 pt)
Em qual regressão há uma evidência mais forte do coeficiente relativo a x
ser diferente de zero? Explique.
b. (1 pt)
Calcule o R2 das duas regressões. De acordo com o R2, qual regressão
possui um melhor ajuste? Explique.
30. Uma variável possui o seguinte comportamento: yt = a + bt + et, onde et é um ruído
sem tendência. Com o uso do operador diferença, mostre que a nova variável definida
por xt = ∆yt não possui tendência. Qual deve ser a média de xt?
31. Uma pessoa desconfia que as vendas da sua empresa estão sujeitas à sazonalidade.
Ela quer obter a sazonalidade com o uso de uma variável Dummy para o 2º Semestre.
Os dados disponíveis de vendas são os seguintes, com início no 1º semestre de 2001, em
milhares de Euros:
Ano
Vendas
Ano
Vendas
2001 1º Sem
100
2004 1º Sem
102
2001 2º Sem
122
2004 2º Sem
119
2002 1º Sem
98
2005 1º Sem
104
2002 2º Sem
124
2005 2º Sem
120
2003 1º Sem
105
2003 2º Sem
118
a. Com uma regressão yt = a + bxt + et, onde yt representa as vendas no período e xt é
uma variável Dummy para o segundo semestre, obtenha os coeficientes a e b.
Nota: a média das vendas em todos os anos acima é igual a 111,20, e a soma das vendas
no segundo semestre é igual a 603.
b. Interprete os valores encontrados no item a. Existe um componente sazonal nas
vendas deste produto? Explique.
10
32. Considere a seguinte informação sobre as importações de um produto e sobre um
índice de preços:
Ano
1999
2000
2001
2002
2003
2004
2005
Importações a
Preços Correntes
(mil Euros)
920
950
1.000
1.080
1.160
1.350
1.450
Índice de Preços
Base 1999
1,000
1,090
1,140
1,200
1,250
Índice de Preços
Base 2003
1,000
1,050
1,100
a. Na sua folha de respostas, complete os valores em falta relativos à evolução do índice
de preços com base em 1999 e em 2003.
b. Calcule o valor das importações, em termos reais, a preços de 2003.
c. Calcule um índice de importações deste produto, a preços de 2003, com base em
1999.
d. Segundo este índice, qual foi o aumento das importações deste produto em termos
reais de 1999 a 2005?
33. Um estudo sobre o efeito da variação da qualidade no índice de preços para Portugal
chegou às seguintes conclusões.
(1) Em 1993, o IPC dos automóveis foi enviesado 5,2 pontos percentuais devido a
alterações de qualidade.
(2) Este enviesamento teve um impacto de 0,3 pontos percentuais no IPC total.
Explique o problema em questão e os resultados.
34. Um modelo relaciona produção (Y), capital (K) e trabalho (L) de acordo com a
relação
Y = AK1/3L2/3.
Um consultor possui dados sobre a produção por trabalhador (Y/L) e capital por
trabalhador (K/L) para uma região. Ele faz a regressão
yi = a + bxi + ei,
onde yi = log(Yi/Li) e xi = log(Ki/Li).
a. Que valor ele deve obter para b para dar suporte ao modelo? Explique.
11
b.
De
∑ (x
acordo
com
os
dados
disponíveis,
temos
x = 4.562 ,
y = 2.239 ,
− x ) = 0.1630 , ∑ ( yi − y ) = 0.02628 e ∑ ( xi − x )( yi − y ) = 0.05286 . Obtenha
os valores de a e b da regressão acima. Interprete.
2
2
i
c. Estes valores dão suporte ao modelo? Explique.
12
Download

1 Faculdade de Economia, Universidade Nova de Lisboa