CONTRIBUIÇÕES AO PROBLEMA DE PREVISÃO FINANCEIRA EM
ALTA-FREQUÊNCIA USANDO MODELOS MORFOLÓGICOS-LINEARES
Ricardo de A. Araújo∗,§ , Adriano L. I. Oliveira∗ , Silvio Meira∗
∗
§
Centro de Informática, Universidade Federal de Pernambuco, Recife, PE, Brasil
Departamento de Informática, Instituto Federal do Sertão Pernambucano, Ouricuri, PE, Brasil
Email: [email protected] ou {raa,alio,srlm}@cin.ufpe.br
Resumo— Este trabalho apresenta um estudo sobre séries financeiras, em alta-frequência, na tentativa de
identificar as caracterı́sticas do seu fenômeno gerador e, baseado neste estudo, propor um modelo, com aprendizagem baseada em gradiente descendente, capaz de prevê-las. Além disso, uma análise experimental é conduzida
com o modelo proposto, utilizando uma série financeira, em alta-frequência, do mercado de ações brasileiro, onde
um conjunto de medidas estatı́sticas são utilizadas para avaliação do desempenho preditivo.
Palavras-chave— Modelo de Previsão, Aprendizagem Baseada em Gradiente Descendente, Mercado de Ações
em Alta-Frequência, Previsão de Séries Temporais.
1
Introdução
O constante desenvolvimento das plataformas eletrônicas de negociação tem aumentado a frequência para realização de operações no mercado de
ações para frações de segundos (Ortega e Khashanah, 2014). Este tipo de operação é conhecida como negociação em alta-frequência (highfrequency trading) (Aldridge, 2013) e tem como
principal objetivo a operação no mercado de
ações, em alta-frequência, sem intervenção humana (Silva et al., 2014).
Desde 2009 a BM&F Bovespa (bolsa de valores brasileira) opera em alta-frequência e, de
acordo com o relatório anual relativo a 2013 da
comissão de valores mobiliários (CVM), o volume
total negociado deste tipo de operação cresceu de
0,6% em 2009 para 12% em 2013, bem como o número de negócios cresceu de 2,5% em 2009 para
36,5% em 2013. Vale mencionar que, no mercado de ações americano, o volume total negociado deste tipo de operação já se aproxima dos 80%
(Chavez-Demoulin e McGill, 2012), o que leva a
crer que o mercado de ações em alta-frequência
(high-frequency stock market, HFSM) seja uma
tendência global (Aldridge, 2013).
Diversos trabalhos foram propostos na literatura relacionados ao HFSM, dentre os quais vale
destacar: i) mineração de dados financeiros (Sun e
Meinl, 2012), ii) clusterização (Chavez-Demoulin
e McGill, 2012), iii) análise de micro padrões
(Aghamohammadi et al., 2014), iv) processos de
criação de mercados (Jabbur et al., 2014), (Silva
et al., 2014), v) análise e previsão de séries temporais (Ortega e Khashanah, 2014), vi) análise de
quebras estruturais (Lean et al., 2015), e vii) análise de volatilidade (Anagnostidis e Emmanouilides, 2015).
Entretanto, os trabalhos de (Caporale e
Gil-Alana, 2013), (Ortega e Khashanah, 2014),
(Aghamohammadi et al., 2014) e (Lean et al.,
2015) mencionam que, no caso particular da previsão de um-passo-adiante, os modelos de previsão clássicos para séries financeiras, em altafrequência, tendem a seguir o dilema do passeio
aleatório (random walk dilemma, RWD). Entretanto, nenhum argumento satisfatório ou prova
matemática foram apresentados para suportar tal
afirmação, sendo esta baseada apenas em análise
empı́rica e, portanto, enfatiza a necessidade de
uma análise mais aprofundada deste tipo particular de série temporal.
Neste contexto, este trabalho apresenta um
estudo sobre as caracterı́sticas do fenômeno gerador de séries financeiras, em alta-frequência e, baseado neste estudo, propor um modelo, composto
por uma combinação balanceada entre operadores lineares e operadores não-lineares crescentes
e decrescentes, capaz de prever este tipo particular de série temporal. Para o processo de aprendizagem do modelo proposto, é apresentado um
método baseado em gradiente descendente. Além
disso, uma análise experimental é conduzida com o
modelo proposto, utilizando uma série financeira,
em alta-frequência, do mercado de ações brasileiro
(Bradesco SA - BBDC4), onde um conjunto de
medidas estatı́sticas são utilizadas para avaliação
do desempenho preditivo.
2
Análise da Série Temporal
Esta seção apresenta uma análise da série financeira, em alta-frequência, investigada neste trabalho.
2.1
Bradesco SA (BBDC4)
A série temporal BBDC4 utilizada neste trabalho
é composta por observações em alta-frequência (01
segundo) do preço de abertura das ações da empresa no dia 01/02/2013, que podem ser ilustradas
na Figura 1.
De acordo com a Figura 1, é possı́vel verificar que no gráfico da série BBDC4 existe a
presença de componentes de tendência de curto
prazo com caracterı́sticas crescentes e decrescentes. Note que, não é possı́vel identificar, apenas
com a análise gráfica, a presença de componentes
sazonais nesta série.
BBDC4
36.6
0.8
36.5
0.6
BBDC4
Autocorrelação
36.4
36.3
0.4
0.2
36.2
0
36.1
1000
2000
3000
4000
Observações
5000
6000
7000
Figura 1: Gráfico da série BBDC4.
−0.2
0
100
200
300
400
500
600
Retardos Temporais
700
800
900
1000
Figura 3: ACF da série BBDC4.
BBDC4
0.8
0.6
Autocorrelação Parcial
Devido ao fato do principal problema na caracterização do fenômeno gerador de uma série
temporal, além da análise gráfica, ser, naturalmente, a escolha dos retardos temporais (dimensionalidade n), utiliza-se o gráfico lagplot (Kantz
e Schreiber, 2003) (apresentado na Figura 2) para
determinar e analisar as relações entre os retardos
temporais da série BBDC4.
0.4
0.2
0
36.6
36.4
36.4
36.2
36
36.2 36.4 36.6
x(t−25)
36.6
36.4
36.4
36.2
36.2
36
36
36.2 36.4 36.6
x(t−100)
x(t)
36.6
36.4
x(t)
36.6
36.4
36.4
x(t)
36.6
36.4
36.2
36
36
36
36.2 36.4 36.6
x(t−500)
36.2 36.4 36.6
x(t−50)
36
36.2 36.4 36.6
x(t−250)
36
36.2 36.4 36.6
x(t−1000)
36
36.2 36.4 36.6
x(t−175)
36.6
36.2
36
36.2
36
x(t)
x(t)
36
36
36.6
36
x(t)
36.2 36.4 36.6
x(t−1)
0
100
200
300
400
500
600
Retardos Temporais
700
800
900
1000
36.2
36
36
36.2
36
36
36.2 36.4 36.6
x(t−750)
Figura 2: Lagplot da série BBDC4.
A partir da análise da Figura 2, é possı́vel
verificar a existência de um relacionamento dominante linear entre os retardos temporais de 1 a 25.
Entretanto, a partir do incremento da ordem dos
retardos temporais (a partir do 50), é possı́vel verificar o aparecimento de uma estrutura não-linear
complexa que caracteriza um relacionamento subdominante não-linear que está embutido no relacionamento dominante linear presente em retardos
temporais de baixa ordem. Tal fato leva a suposição que o fenômeno gerador de séries temporais
financeiras, em alta-frequência, não é construı́do a
partir de processos aleatórios, mas por uma combinação balanceada entre um relacionamento dominante linear e um relacionamento sub-dominante
não-linear.
Neste contexto, ambas as funções de autocorrelação (autocorrelation function, ACF) (Box
et al., 1994) e de autocorrelação parcial (partial autocorrelation function, PACF) (Box et al.,
1994), ilustradas nas Figuras 3 e 4, respectivamente, são utilizadas para analisar o comportamento da componente dominante linear.
Note que, de acordo com as Figuras 3 e 4,
as ACF e PACF da série BBDC4 apresentam um
caracterı́stico decaimento hiperbólico, o que confirma a suposição da presença de uma forte dependência linear (caracterizado pela componente
Figura 4: PACF da série BBDC4.
dominante linear encontrado no lagplot ) no fenômeno gerador destas séries, uma vez que é possı́vel verificar altas correlações em retardos temporais de baixa ordem, bem como baixas correlações em retardos temporais de alta ordem. Entretanto, nada se pode observar em relação a natureza da componente não-linear a partir da análise
das ACF e PACF, uma vez que de acordo com
(Box et al., 1994) estas funções só podem ser utilizadas para análise da dependência linear presente
no fenômeno gerador da série temporal.
Desta forma, a informação mútua média
(mean mutual information, MMI) (Fraser e Swinney, 1986), (Kraskov et al., 2004), ilustrada na Figura 5, é utilizada para se analisar a componente
sub-dominante não-linear, uma vez que a MMI representa uma medida de dependência não-linear.
BBDC4
3
2.5
Informação Mútua Média
36.2
x(t)
36.6
36.4
x(t)
x(t)
−0.2
36.6
2
1.5
1
0.5
0
0
100
200
300
400
500
600
Retardos Temporais
700
800
900
1000
Figura 5: MMI da série BBDC4.
De acordo com a Figura 5, é possı́vel verificar a existência de dependência não-linear na série
BBDC4 (MMI > 0), uma vez que a curva do gráfico se estabiliza, para um valor próximo de 0.8, a
partir da dimensionalidade n = 600. Note que, a
inexistência de dependência não-linear implicaria
em um valor nulo para a MMI. Entretanto, vale
mencionar que o gráfico da MMI não possibilita a
análise da natureza da dependência não-linear de
uma série temporal.
Neste contexto, investigou-se o parâmetro de
Hurst (Hurst parameter, HP) (Hurst, 1951) para
determinar se o fenômeno gerador da série BBDC4
tende a um passeio aleatório (HP= 0.5) ou a um
processo auto-similar com dependência de curto
(0.5 <HP≤ 1) ou longo (0 ≤HP< 0.5) prazos
(Menezes et al., 2009). O HP estimado para a
série BBDC4 foi de 0, 1308, o que confirma a suposição que a série em questão é um processo
auto-similar com dependência de longo prazo (série anti-persistente – uma tendência crescente no
tempo passado é mais provável de se converter em
uma tendência decrescente, e vice versa).
Além disso, é possı́vel verificar, a partir da
Figura 1, que as tendências deste processo autosimilar possuem caracterı́sticas locais com comportamento crescente e decrescente, o que leva
a crer que o relacionamento sub-dominante nãolinear presente neste tipo particular de série temporal pode ser aproximado utilizando uma combinação balanceada entre mapeamentos crescentes e decrescentes. Desta forma, este trabalho
assume que a série BBDC4 é gerada por xt =
xt−1 + g(t) + rt , em que xt−1 representa uma componente dominante linear, g(t) representa uma
componente sub-dominante não-linear com comportamento crescente e decrescente, e rt representa um termo de ruı́do gerado por uma distribuição gaussiana com média zero e desvio padrão
dado por σ (N (0, σ)).
3
O Modelo Proposto
O modelo proposto, referido como neurônio crescente decrescente linear (increasing decreasing linear neuron, IDLN), consiste de uma combinação
entre operadores não-lineares crescentes (dilatação e erosão), operadores não-lineares decrescentes (anti-dilatação e anti-erosão) e um operador
linear (perceptron linear). A seguir será apresentada a definição formal do IDLN.
Seja x = (x1 , x2 , . . . , xn ) ∈ Rn um padrão de
entrada, representado pelos retardos temporais de
uma série temporal, sobre uma i-ézima janela deslizante, e seja y a saı́da, representada pela previsão, do IDLN, com regra de transformação local
do tipo x → y e formalmente definido por
y = λα + (1 − λ)β,
onde
β=
n
λ ∈ [0, 1],
xi pi ,
(1)
(2)
i=1
e
α = θτ + (1 − θ)κ,
θ ∈ [0, 1],
(3)
e
κ = ωδ + (1 − ω)ε,
com
δ = δa (x) =
ε = εb (x) =
δ = δ c (x) =
ε = εd (x) =
ϕ ∈ [0, 1],
(4)
n
(5)
(xi + ai ),
(6)
(xi + bi ),
(7)
(x∗i + ci ),
(8)
i=1
n
i=1
n
i=1
n
(x∗i + di ),
(9)
i=1
onde o termo n representa a dimensionalidade do
padrão de entrada (x), os termos λ, θ, ϕ, ω ∈ R,
e os termos a, b, c, d, p ∈ Rn . O vetor p representa os coeficientes (pesos) do operador linear.
O termo β representa a saı́da do operador linear
(módulo linear). O termo α representa o módulo
não-linear, dado pela combinação linear (o termo
de combinação é dado por θ) entre o módulo nãolinear crescente (definido por τ ) e o módulo nãolinear decrescente (definido por κ). O termo τ
representa a combinação linear (o termo de combinação é dado por ϕ) entre o operador morfológico de dilatação (definido por δ) e o operador
morfológico de erosão (definido por ε). O termo κ
representa a combinação linear (o termo de combinação é dado por ω) entre o operador morfológico de anti-dilatação (definido por δ) e o operador
morfológico de anti-erosão (definido por ε). Os vetores a, b, c e d representam, respectivamente, os
elementos estruturantes (pesos) dos operadores de
dilatação (δa (x)) e erosão (εb (x)) (empregados no
módulo não-linear crescente) e de anti-dilatação
(δ c (x)) e anti-erosão (εd (x)) (empregados no módulo não-linear decrescente). Note que a saı́da y
do IDLN é dada por uma combinação linear entre
o modulo linear e o módulo não-linear (o termo de
combinação da saı́da do IDLN é dado por λ).
3.1
Processo de Aprendizagem
A partir da definição do modelo IDLN, é possı́vel
verificar que este requer o ajuste dos parâmetros
a, b, c, d, p ∈ Rn e λ, θ, ϕ, ω ∈ R. Portanto, o
vetor de pesos w (note que w ∈ R5n+4 ) do modelo
IDLN é definido por
w = (λ, θ, ϕ, ω, p, a, b, c, d).
(10)
Na fase de treinamento, os pesos do modelo
IDLN são ajustados de acordo com um critério de
erro até a convergência, isto é, até o critério de parada ser alcançado. Portanto, é necessário definir
uma função objetivo, em termos dos pesos J(w), a
ser minimizada durante a fase de treinamento (representada pelo erro de previsão do modelo IDLN
utilizando o vetor de pesos w), sendo definida por
em que
τ = ϕδ + (1 − ϕ)ε,
ω ∈ [0, 1],
J(w) =
M
1 2
e (m),
M m=1
(11)
onde M representa a quantidade de padrões de
treinamento e e(m) representa o erro instantâneo
do modelo para o m-ésimo padrão de treinamento.
Neste trabalho, um método de gradiente descendente utilizando ideias do algoritmo de retropropagação do erro (back propagation, BP)
(Haykin, 1998) é proposto para ajustar o vetor de
pesos do modelo. Portanto, o processo de aprendizagem do modelo IDLN consiste na atualização
iterativa do vetor de pesos w baseada no método
do gradiente descendente. O ajuste do vetor de
pesos w para o m-ésimo padrão de treinamento é
dado por:
w(i + 1) = w(i) − μ∇J(w),
(12)
em que i ∈ {1, 2, . . .} e o termo μ representa o
tamanho do passo de aprendizagem ou taxa de
aprendizagem, sendo responsável por regular o
equilı́brio entre a estabilidade e velocidade de convergência do processo de aprendizagem do modelo.
O termo ∇J(w) é dado pelo gradiente de J em relação a w e dado por
∇J(w) =
∂y
∂J ∂y
= −2e(m)
,
∂y ∂w
∂w
e
O termo
O termo
∂y
∂θ
é calculado por
∂y
∂y ∂α
=
,
∂θ
∂α ∂θ
∂y
= λ,
∂α
e
∂α
= τ − κ.
∂θ
O termo
∂y
∂ϕ
(18)
é calculado por
∂y ∂α ∂τ
∂α ∂τ
∂y
=
=λ
,
∂ϕ
∂α ∂τ ∂ϕ
∂τ ∂ϕ
(19)
em que
e
O termo
∂y
∂ω
∂α
= θ,
∂τ
(20)
∂τ
= δ − ε.
∂ϕ
(21)
é calculado por
∂y
∂y ∂α ∂κ
∂α ∂κ
=
=λ
,
∂ω
∂α ∂κ ∂ω
∂κ ∂ω
(22)
∂α
= 1 − θ,
∂κ
(23)
em que
∂y
= 1 − λ,
∂β
(26)
(28)
∂τ
= ϕ,
∂δ
(29)
∂δ
Qσ (δ ·1 − (x + a))
=
.
∂a
Qσ (δ ·1 − (x + a)) · 1T
(30)
O termo
∂y
∂b
pode ser calculado por:
∂y ∂α ∂τ ∂ε
∂τ ∂ε
∂y
=
= λθ
,
∂b
∂α ∂τ ∂ε ∂b
∂ε ∂b
(31)
∂τ
= 1 − ϕ,
∂ε
(32)
Qσ (ε ·1 − (x + b))
∂ε
=
.
∂b
Qσ (ε ·1 − (x + b)) · 1T
(33)
em que
e
(16)
(17)
(25)
∂y ∂α ∂τ ∂δ
∂τ ∂δ
∂y
=
= λθ
,
∂a
∂α ∂τ ∂δ ∂a
∂δ ∂a
O termo
em que
∂y ∂β
∂y
=
,
∂p
∂β ∂p
em que
e
(15)
é calculado por
∂β
= x,
(27)
∂p
em que x representa o m-ésimo padrão de treinamento.
∂y
pode ser calculado por:
O termo ∂a
∂y
= α − β.
∂λ
(24)
e
(13)
∂y ∂y ∂y ∂y ∂y ∂y ∂y ∂y ∂y
,
,
,
,
,
,
,
,
∂λ ∂θ ∂ϕ ∂ω ∂p ∂a ∂b ∂c ∂d
(14)
∂y
O termo ∂λ
é calculado por
∂y
=
∂w
∂y
∂p
onde
em que
∂κ
= δ − ε.
∂ω
∂y
∂c
pode ser calculado por:
∂y ∂α ∂κ ∂δ
∂κ ∂δ
∂y
=
= λ(1 − θ)
,
∂c
∂α ∂κ ∂δ ∂c
∂δ ∂c
em que
∂κ
= ω,
∂δ
e
Qσ δ ·1 − (x∗ + c)
∂δ
=
.
∂c
Qσ δ ·1 − (x∗ + c) · 1T
O termo
∂y
∂d
(34)
(35)
(36)
pode ser calculado por:
∂y ∂α ∂κ ∂ε
∂κ ∂ε
∂y
=
= λ(1 − θ)
,
∂d
∂α ∂κ ∂ε ∂d
∂ε ∂d
em que
∂κ
= 1 − ω,
∂ε
e
∂ε
Qσ (ε ·1 − (x∗ + d))
=
.
∂d
Qσ (ε ·1 − (x∗ + d)) · 1T
(37)
(38)
(39)
Vale mencionar a função de impulso suave
Qσ (x) = [qσ (x1 ), qσ (x2 ), . . . , qσ (xn )], é dada por
1 xi 2
qσ (xi ) = exp
, ∀ i = 1, . . . , n . (40)
2 σ
Resultados Experimentais
A série temporal BBDC4 foi normalizada no intervalo [0, 1] e dividida em três conjuntos: treinamento (50% dos dados), validação (25% dos
dados) e teste (25% dos dados). Vale mencionar que o procedimento de ajuste de fase (phase
fix procedure, PFP) (Ferreira et al., 2008) foi utilizado diretamente no processo de aprendizagem
para ajustar distorções de fase temporais caracterı́sticas em fenômenos temporais financeiros. As
seguintes medidas foram utilizadas para avaliar o
desempenho preditivo (Ferreira et al., 2008): erro
médio percentual absoluto (MAPE), estatı́stica u
de theil (THEIL) e previsão de mudança na direção (POCID).
Para realização dos experimentos com o modelo proposto, é necessário definir uma arquitetura básica, dada pela notação IDLN (lags;μ;σ),
em que lags define os retardos temporais utilizados para representar o fenômeno temporal, μ representa a taxa de aprendizagem, e σ representa
o fator de escala da função de impulso suave. A
escolha dos retardos temporais foi baseada na análise da série, onde foram fixados os retardos temporais 2 até 1001 (lags = 2 − 1001) para todos
os experimentos. Também, vale mencionar que o
primeiro retardo temporal não é utilizado porque
é necessário se criar uma estrutura de passeio aleatório para a utilização do PFP.
O valor de μ é determinado empiricamente
através de uma série de experimentos, onde foi
escolhido o valor 0.1. O valor de σ também é determinado empiricamente através de uma série de
experimentos, onde foi escolhido o valor 0.5. Os
valores iniciais do vetor de pesos do modelo IDLN
são: a, b, c, d, p ∈ [−1, 1] e λ, θ, ϕ, ω ∈ [0, 1].
No processo de treinamento do IDLN três condições de parada são utilizadas: i) quantidade máxima de épocas de treinamento (104 ), ii) P t ≤
10−6 , e iii) Gl ≥ 5%. Todos os experimentos com
o modelo IDLN foram desenvolvidos e implementados utilizando a ferramenta Matlab. Por fim,
para cada arquitetura investigada, são realizados
cinquenta experimentos, onde são calculadas as estatı́sticas básicas: média (MEAN), mediana (MEDIAN), raiz do erro quadrático médio (root mean
square, RMS), percentis 2.5% (PERC25) e 97.5%
(PERC975), valor mı́nimo (MIN) e valor máximo
(MAX).
4.1
Tabela 1: Desempenho preditivo para a série
BBDC4 (conjunto de teste).
Modelo
RW
IDLN
Estatı́stica
MEAN
RMS
MEDIAN
PERC25
PERC975
MIN
MAX
MEAN
RMS
MEDIAN
PERC25
PERC975
MIN
MAX
MAPE
1,7489e-02
1,7489e-02
1,7489e-02
1,7489e-02
1,7489e-02
1,7489e-02
1,7489e-02
5,0647e-04
6,2933e-04
4,0259e-04
1,3423e-04
1,6069e-03
1,3027e-04
2,4647e-03
Medida
POCID
78,34
78,34
78,34
78,34
78,34
78,34
78,34
100,00
100,00
100,00
100,00
100,00
100,00
100,00
THEIL
1,0000e+00
1,0000e+00
1,0000e+00
1,0000e+00
1,0000e+00
1,0000e+00
1,0000e+00
6,0567e-04
1,4405e-03
2,4876e-04
2,8119e-05
4,2500e-03
2,6201e-05
9,0313e-03
Tabela 2: Resultados do teste de Wilcoxon.
IDLN
p-valor
3,3111e-20
2,6280e-23
3,3111e-20
Medida
MAPE
POCID
THEIL
/ RW
h
1,0000e+00
1,0000e+00
1,0000e+00
sideram a rejeição da hipótese nula a 5% de nı́vel
de significância, para todas as medidas investigadas. Neste contexto, o teste de Wilcoxon revela
que o modelo proposto tem desempenho preditivo estatı́sticamente superior a um passeio aleatório. A Figura 6 apresenta um gráfico comparativo
entre os valores reais da série e os valores preditos pelo modelo proposto, considerando os últimos
dez pontos do conjunto de teste da série temporal
BBDC4.
BBDC4
36.44
36.43
36.42
36.41
36.4
Preço
4
36.39
36.38
36.37
36.36
Valores Reais
IDLN
RW
36.35
1
2
3
4
5
6
Observações
7
8
9
10
Figura 6: Resultados de previsão da série BBDC4
(últimos dez pontos do conjunto de teste).
BBDC4
A Tabela 1 apresenta os resultados alcançados
pelo modelo proposto (IDLN) e por um passeio
aleatório (RW) para a série BBDC4.
De acordo com a Tabela 1, é possı́vel verificar
que, para todas as medidas investigadas, o modelo
proposto obteve resultados superiores a um passeio aleatório. A Tabela 2 apresenta os p-valor e o
teste de decisão (h), para todas as medidas investigadas, do teste não-paramétrico de Wilcoxon.
Os resultados apresentados na Tabela 2 con-
5
Conclusões
Este trabalho apresentou um estudo sobre previsão de séries temporais financeiras, em altafrequência. Neste contexto, foi utilizada a série
do Bradesco SA (BBDC4), referente aos preços de
abertura, com frequência de 01 segundo. A análise do lagplot desta série nos permitiu levantar a
suposição da existência de uma componente dominante linear presente em retardos temporais de
baixa ordem. Esta suposição foi confirmada pelo
decaimento hiperbólico encontrado nas funções de
autocorrelação e autocorrelação parcial, onde foi
possı́vel identificar altas correlações em retardos
de baixa ordem e baixas correlações em retardos
de alta ordem. Também, o lagplot permitiu levantar a suposição da existência de uma componente
sub-dominante não-linear em retardos temporais
de alta ordem. A confirmação desta suposição foi
baseada na informação mútua média, que revelou
a existência de uma dependência não-linear na série. Por fim, o parâmetro de Hurst revelou que
o fenômeno gerador da série é um processo autosimilar com dependência de longo prazo (com caracterı́sticas anti-persistentes), confirmando a suposição que séries financeiras, em alta-frequência,
não são geradas por processo aleatório.
Baseado neste estudo, este trabalho apresentou um modelo previsão para séries temporais financeiras, em alta-frequência, que atenda a todos
estas caracterı́sticas. Para o processo de aprendizagem, foi desenvolvido um método baseado em
gradiente descendente utilizando ideias do algoritmo de retropropagação do erro. Os resultados
alcançados mostraram que, para todas as métricas
investigadas, o modelo proposto possui desempenho preditivo estatisticamente superior a um passeio aleatório, isto é, o modelo proposto foi capaz
de superar o dilema.
Como trabalhos futuros pretende-se investigar outras séries temporais financeiras, em altafrequência, para confirmação dos resultados alcançados neste trabalho, bem como pretende-se
investigar o desempenho de modelos clássicos de
previsão financeira para o caso particular em altafrequência.
Referências
Aghamohammadi, C., Ebrahimian, M. e Tahmooresi, H. (2014). Permutation approach,
high frequency trading and variety of micro
patterns in financial time series, Physica A
413: 25–30.
Chavez-Demoulin, V. e McGill, J. A. (2012).
High-frequency financial data modeling using
hawkes processes, Journal of Banking & Finance 36: 3415–3426.
Ferreira, T. A. E., Vasconcelos, G. C. e Adeodato,
P. J. L. (2008). A new intelligent system
methodology for time series forecasting with
artificial neural networks, Neural Processing
Letters, Vol. 28, pp. 113–129.
Fraser, A. e Swinney, H. (1986). Independent coordinates for strange atractors from mutual
information, Physical Review A 33(2): 1134–
1140.
Haykin, S. (1998). Neural networks: A comprehensive foundation, Prentice Hall, New
Jersey.
Hurst, E. (1951). Long term storage capacity of
reservoirs, Transactions of the American Society of Civil Engenieers 116: 770–799.
Jabbur, E., Silva, E., Castilho, D., Pereira, A. e
Brandao, H. (2014). Design and evaluation
of automatic agents for stock market intraday trading, International Joint Conferences
on Web Intelligence and Intelligent Agent Technologies .
Kantz, H. e Schreiber, T. (2003). Nonlinear Time
Series analysis, second edn, Cambridge University Press, New York, NY, USA.
Kraskov, A., Stgbauer, H. e Grassberger, P.
(2004). A new auto-associative memory based on lattice algebra, Phys. Rev. E 69(6).
Lean, H. H., Mishra, V. e Smyth, R. (2015). The
relevance of heteroskedasticity and structural
breaks when testing for a random walk with
high-frequency financial data: Evidence from
asean stock markets, The Handbook of High
Frequency Trading pp. 59–73.
Aldridge, I. (2013). High-frequency trading: a
practical guide to algorithmic strategies and
trading systems, John Wiley & Sons.
Menezes, J. M. P., Barreto, G. A. e Freire, A. L.
(2009). Redes neurais recorrentes para predição recursiva de séries temporais caóticas:
Um estudo comparativo, Congresso Brasileiro de Redes Neurais Artificiais .
Anagnostidis, P. e Emmanouilides, C. J. (2015).
Nonlinearity in high-frequency stock returns:
Evidence from the athens stock exchange,
Physica A 421: 473–487.
Ortega, L. e Khashanah, K. (2014). A neurowavelet model for the short-term forecasting
of high-frequency time series of stock returns,
Journal of Forecasting 33: 134–146.
Box, G. E. P., Jenkins, G. M. e Reinsel, G. C.
(1994). Time Series Analysis: Forecasting
and Control, third edn, Prentice Hall, New
Jersey.
Silva, E., Castilho, D., Pereira, A. e Brandao, H.
(2014). A neural network based approach
to support the market making strategies in
high-frequency trading, International Joint
Conference on Neural Networks .
Caporale, G. M. e Gil-Alana, L. A. (2013). Long
memory and fractional integration in high
frequency data on the us dollar-british pound
spot exchange rate, International Review of
Financial Analysis 29: 1–9.
Sun, E. W. e Meinl, T. (2012). A new waveletbased denoising algorithm for high-frequency
financial data mining, European Journal of
Operational Research 217: 589–599.
Download

CONTRIBUI¸C˜OES AO PROBLEMA DE PREVIS˜AO