CONTRIBUIÇÕES AO PROBLEMA DE PREVISÃO FINANCEIRA EM
ALTA-FREQUÊNCIA USANDO MODELOS MORFOLÓGICOS-LINEARES
Ricardo de A. Araújo∗,§ , Adriano L. I. Oliveira∗ , Silvio Meira∗
∗
§
Centro de Informática, Universidade Federal de Pernambuco, Recife, PE, Brasil
Departamento de Informática, Instituto Federal do Sertão Pernambucano, Ouricuri, PE, Brasil
Email: [email protected] ou {raa,alio,srlm}@cin.ufpe.br
Resumo— Este trabalho apresenta um estudo sobre séries financeiras, em alta-frequência, na tentativa de
identificar as caracterı́sticas do seu fenômeno gerador e, baseado neste estudo, propor um modelo, com aprendizagem baseada em gradiente descendente, capaz de prevê-las. Além disso, uma análise experimental é conduzida
com o modelo proposto, utilizando uma série financeira, em alta-frequência, do mercado de ações brasileiro, onde
um conjunto de medidas estatı́sticas são utilizadas para avaliação do desempenho preditivo.
Palavras-chave— Modelo de Previsão, Aprendizagem Baseada em Gradiente Descendente, Mercado de Ações
em Alta-Frequência, Previsão de Séries Temporais.
1
Introdução
O constante desenvolvimento das plataformas eletrônicas de negociação tem aumentado a frequência para realização de operações no mercado de
ações para frações de segundos (Ortega e Khashanah, 2014). Este tipo de operação é conhecida como negociação em alta-frequência (highfrequency trading) (Aldridge, 2013) e tem como
principal objetivo a operação no mercado de
ações, em alta-frequência, sem intervenção humana (Silva et al., 2014).
Desde 2009 a BM&F Bovespa (bolsa de valores brasileira) opera em alta-frequência e, de
acordo com o relatório anual relativo a 2013 da
comissão de valores mobiliários (CVM), o volume
total negociado deste tipo de operação cresceu de
0,6% em 2009 para 12% em 2013, bem como o número de negócios cresceu de 2,5% em 2009 para
36,5% em 2013. Vale mencionar que, no mercado de ações americano, o volume total negociado deste tipo de operação já se aproxima dos 80%
(Chavez-Demoulin e McGill, 2012), o que leva a
crer que o mercado de ações em alta-frequência
(high-frequency stock market, HFSM) seja uma
tendência global (Aldridge, 2013).
Diversos trabalhos foram propostos na literatura relacionados ao HFSM, dentre os quais vale
destacar: i) mineração de dados financeiros (Sun e
Meinl, 2012), ii) clusterização (Chavez-Demoulin
e McGill, 2012), iii) análise de micro padrões
(Aghamohammadi et al., 2014), iv) processos de
criação de mercados (Jabbur et al., 2014), (Silva
et al., 2014), v) análise e previsão de séries temporais (Ortega e Khashanah, 2014), vi) análise de
quebras estruturais (Lean et al., 2015), e vii) análise de volatilidade (Anagnostidis e Emmanouilides, 2015).
Entretanto, os trabalhos de (Caporale e
Gil-Alana, 2013), (Ortega e Khashanah, 2014),
(Aghamohammadi et al., 2014) e (Lean et al.,
2015) mencionam que, no caso particular da previsão de um-passo-adiante, os modelos de previsão clássicos para séries financeiras, em altafrequência, tendem a seguir o dilema do passeio
aleatório (random walk dilemma, RWD). Entretanto, nenhum argumento satisfatório ou prova
matemática foram apresentados para suportar tal
afirmação, sendo esta baseada apenas em análise
empı́rica e, portanto, enfatiza a necessidade de
uma análise mais aprofundada deste tipo particular de série temporal.
Neste contexto, este trabalho apresenta um
estudo sobre as caracterı́sticas do fenômeno gerador de séries financeiras, em alta-frequência e, baseado neste estudo, propor um modelo, composto
por uma combinação balanceada entre operadores lineares e operadores não-lineares crescentes
e decrescentes, capaz de prever este tipo particular de série temporal. Para o processo de aprendizagem do modelo proposto, é apresentado um
método baseado em gradiente descendente. Além
disso, uma análise experimental é conduzida com o
modelo proposto, utilizando uma série financeira,
em alta-frequência, do mercado de ações brasileiro
(Bradesco SA - BBDC4), onde um conjunto de
medidas estatı́sticas são utilizadas para avaliação
do desempenho preditivo.
2
Análise da Série Temporal
Esta seção apresenta uma análise da série financeira, em alta-frequência, investigada neste trabalho.
2.1
Bradesco SA (BBDC4)
A série temporal BBDC4 utilizada neste trabalho
é composta por observações em alta-frequência (01
segundo) do preço de abertura das ações da empresa no dia 01/02/2013, que podem ser ilustradas
na Figura 1.
De acordo com a Figura 1, é possı́vel verificar que no gráfico da série BBDC4 existe a
presença de componentes de tendência de curto
prazo com caracterı́sticas crescentes e decrescentes. Note que, não é possı́vel identificar, apenas
com a análise gráfica, a presença de componentes
sazonais nesta série.
BBDC4
36.6
0.8
36.5
0.6
BBDC4
Autocorrelação
36.4
36.3
0.4
0.2
36.2
0
36.1
1000
2000
3000
4000
Observações
5000
6000
7000
Figura 1: Gráfico da série BBDC4.
−0.2
0
100
200
300
400
500
600
Retardos Temporais
700
800
900
1000
Figura 3: ACF da série BBDC4.
BBDC4
0.8
0.6
Autocorrelação Parcial
Devido ao fato do principal problema na caracterização do fenômeno gerador de uma série
temporal, além da análise gráfica, ser, naturalmente, a escolha dos retardos temporais (dimensionalidade n), utiliza-se o gráfico lagplot (Kantz
e Schreiber, 2003) (apresentado na Figura 2) para
determinar e analisar as relações entre os retardos
temporais da série BBDC4.
0.4
0.2
0
36.6
36.4
36.4
36.2
36
36.2 36.4 36.6
x(t−25)
36.6
36.4
36.4
36.2
36.2
36
36
36.2 36.4 36.6
x(t−100)
x(t)
36.6
36.4
x(t)
36.6
36.4
36.4
x(t)
36.6
36.4
36.2
36
36
36
36.2 36.4 36.6
x(t−500)
36.2 36.4 36.6
x(t−50)
36
36.2 36.4 36.6
x(t−250)
36
36.2 36.4 36.6
x(t−1000)
36
36.2 36.4 36.6
x(t−175)
36.6
36.2
36
36.2
36
x(t)
x(t)
36
36
36.6
36
x(t)
36.2 36.4 36.6
x(t−1)
0
100
200
300
400
500
600
Retardos Temporais
700
800
900
1000
36.2
36
36
36.2
36
36
36.2 36.4 36.6
x(t−750)
Figura 2: Lagplot da série BBDC4.
A partir da análise da Figura 2, é possı́vel
verificar a existência de um relacionamento dominante linear entre os retardos temporais de 1 a 25.
Entretanto, a partir do incremento da ordem dos
retardos temporais (a partir do 50), é possı́vel verificar o aparecimento de uma estrutura não-linear
complexa que caracteriza um relacionamento subdominante não-linear que está embutido no relacionamento dominante linear presente em retardos
temporais de baixa ordem. Tal fato leva a suposição que o fenômeno gerador de séries temporais
financeiras, em alta-frequência, não é construı́do a
partir de processos aleatórios, mas por uma combinação balanceada entre um relacionamento dominante linear e um relacionamento sub-dominante
não-linear.
Neste contexto, ambas as funções de autocorrelação (autocorrelation function, ACF) (Box
et al., 1994) e de autocorrelação parcial (partial autocorrelation function, PACF) (Box et al.,
1994), ilustradas nas Figuras 3 e 4, respectivamente, são utilizadas para analisar o comportamento da componente dominante linear.
Note que, de acordo com as Figuras 3 e 4,
as ACF e PACF da série BBDC4 apresentam um
caracterı́stico decaimento hiperbólico, o que confirma a suposição da presença de uma forte dependência linear (caracterizado pela componente
Figura 4: PACF da série BBDC4.
dominante linear encontrado no lagplot ) no fenômeno gerador destas séries, uma vez que é possı́vel verificar altas correlações em retardos temporais de baixa ordem, bem como baixas correlações em retardos temporais de alta ordem. Entretanto, nada se pode observar em relação a natureza da componente não-linear a partir da análise
das ACF e PACF, uma vez que de acordo com
(Box et al., 1994) estas funções só podem ser utilizadas para análise da dependência linear presente
no fenômeno gerador da série temporal.
Desta forma, a informação mútua média
(mean mutual information, MMI) (Fraser e Swinney, 1986), (Kraskov et al., 2004), ilustrada na Figura 5, é utilizada para se analisar a componente
sub-dominante não-linear, uma vez que a MMI representa uma medida de dependência não-linear.
BBDC4
3
2.5
Informação Mútua Média
36.2
x(t)
36.6
36.4
x(t)
x(t)
−0.2
36.6
2
1.5
1
0.5
0
0
100
200
300
400
500
600
Retardos Temporais
700
800
900
1000
Figura 5: MMI da série BBDC4.
De acordo com a Figura 5, é possı́vel verificar a existência de dependência não-linear na série
BBDC4 (MMI > 0), uma vez que a curva do gráfico se estabiliza, para um valor próximo de 0.8, a
partir da dimensionalidade n = 600. Note que, a
inexistência de dependência não-linear implicaria
em um valor nulo para a MMI. Entretanto, vale
mencionar que o gráfico da MMI não possibilita a
análise da natureza da dependência não-linear de
uma série temporal.
Neste contexto, investigou-se o parâmetro de
Hurst (Hurst parameter, HP) (Hurst, 1951) para
determinar se o fenômeno gerador da série BBDC4
tende a um passeio aleatório (HP= 0.5) ou a um
processo auto-similar com dependência de curto
(0.5 <HP≤ 1) ou longo (0 ≤HP< 0.5) prazos
(Menezes et al., 2009). O HP estimado para a
série BBDC4 foi de 0, 1308, o que confirma a suposição que a série em questão é um processo
auto-similar com dependência de longo prazo (série anti-persistente – uma tendência crescente no
tempo passado é mais provável de se converter em
uma tendência decrescente, e vice versa).
Além disso, é possı́vel verificar, a partir da
Figura 1, que as tendências deste processo autosimilar possuem caracterı́sticas locais com comportamento crescente e decrescente, o que leva
a crer que o relacionamento sub-dominante nãolinear presente neste tipo particular de série temporal pode ser aproximado utilizando uma combinação balanceada entre mapeamentos crescentes e decrescentes. Desta forma, este trabalho
assume que a série BBDC4 é gerada por xt =
xt−1 + g(t) + rt , em que xt−1 representa uma componente dominante linear, g(t) representa uma
componente sub-dominante não-linear com comportamento crescente e decrescente, e rt representa um termo de ruı́do gerado por uma distribuição gaussiana com média zero e desvio padrão
dado por σ (N (0, σ)).
3
O Modelo Proposto
O modelo proposto, referido como neurônio crescente decrescente linear (increasing decreasing linear neuron, IDLN), consiste de uma combinação
entre operadores não-lineares crescentes (dilatação e erosão), operadores não-lineares decrescentes (anti-dilatação e anti-erosão) e um operador
linear (perceptron linear). A seguir será apresentada a definição formal do IDLN.
Seja x = (x1 , x2 , . . . , xn ) ∈ Rn um padrão de
entrada, representado pelos retardos temporais de
uma série temporal, sobre uma i-ézima janela deslizante, e seja y a saı́da, representada pela previsão, do IDLN, com regra de transformação local
do tipo x → y e formalmente definido por
y = λα + (1 − λ)β,
onde
β=
n
λ ∈ [0, 1],
xi pi ,
(1)
(2)
i=1
e
α = θτ + (1 − θ)κ,
θ ∈ [0, 1],
(3)
e
κ = ωδ + (1 − ω)ε,
com
δ = δa (x) =
ε = εb (x) =
δ = δ c (x) =
ε = εd (x) =
ϕ ∈ [0, 1],
(4)
n
(5)
(xi + ai ),
(6)
(xi + bi ),
(7)
(x∗i + ci ),
(8)
i=1
n
i=1
n
i=1
n
(x∗i + di ),
(9)
i=1
onde o termo n representa a dimensionalidade do
padrão de entrada (x), os termos λ, θ, ϕ, ω ∈ R,
e os termos a, b, c, d, p ∈ Rn . O vetor p representa os coeficientes (pesos) do operador linear.
O termo β representa a saı́da do operador linear
(módulo linear). O termo α representa o módulo
não-linear, dado pela combinação linear (o termo
de combinação é dado por θ) entre o módulo nãolinear crescente (definido por τ ) e o módulo nãolinear decrescente (definido por κ). O termo τ
representa a combinação linear (o termo de combinação é dado por ϕ) entre o operador morfológico de dilatação (definido por δ) e o operador
morfológico de erosão (definido por ε). O termo κ
representa a combinação linear (o termo de combinação é dado por ω) entre o operador morfológico de anti-dilatação (definido por δ) e o operador
morfológico de anti-erosão (definido por ε). Os vetores a, b, c e d representam, respectivamente, os
elementos estruturantes (pesos) dos operadores de
dilatação (δa (x)) e erosão (εb (x)) (empregados no
módulo não-linear crescente) e de anti-dilatação
(δ c (x)) e anti-erosão (εd (x)) (empregados no módulo não-linear decrescente). Note que a saı́da y
do IDLN é dada por uma combinação linear entre
o modulo linear e o módulo não-linear (o termo de
combinação da saı́da do IDLN é dado por λ).
3.1
Processo de Aprendizagem
A partir da definição do modelo IDLN, é possı́vel
verificar que este requer o ajuste dos parâmetros
a, b, c, d, p ∈ Rn e λ, θ, ϕ, ω ∈ R. Portanto, o
vetor de pesos w (note que w ∈ R5n+4 ) do modelo
IDLN é definido por
w = (λ, θ, ϕ, ω, p, a, b, c, d).
(10)
Na fase de treinamento, os pesos do modelo
IDLN são ajustados de acordo com um critério de
erro até a convergência, isto é, até o critério de parada ser alcançado. Portanto, é necessário definir
uma função objetivo, em termos dos pesos J(w), a
ser minimizada durante a fase de treinamento (representada pelo erro de previsão do modelo IDLN
utilizando o vetor de pesos w), sendo definida por
em que
τ = ϕδ + (1 − ϕ)ε,
ω ∈ [0, 1],
J(w) =
M
1 2
e (m),
M m=1
(11)
onde M representa a quantidade de padrões de
treinamento e e(m) representa o erro instantâneo
do modelo para o m-ésimo padrão de treinamento.
Neste trabalho, um método de gradiente descendente utilizando ideias do algoritmo de retropropagação do erro (back propagation, BP)
(Haykin, 1998) é proposto para ajustar o vetor de
pesos do modelo. Portanto, o processo de aprendizagem do modelo IDLN consiste na atualização
iterativa do vetor de pesos w baseada no método
do gradiente descendente. O ajuste do vetor de
pesos w para o m-ésimo padrão de treinamento é
dado por:
w(i + 1) = w(i) − μ∇J(w),
(12)
em que i ∈ {1, 2, . . .} e o termo μ representa o
tamanho do passo de aprendizagem ou taxa de
aprendizagem, sendo responsável por regular o
equilı́brio entre a estabilidade e velocidade de convergência do processo de aprendizagem do modelo.
O termo ∇J(w) é dado pelo gradiente de J em relação a w e dado por
∇J(w) =
∂y
∂J ∂y
= −2e(m)
,
∂y ∂w
∂w
e
O termo
O termo
∂y
∂θ
é calculado por
∂y
∂y ∂α
=
,
∂θ
∂α ∂θ
∂y
= λ,
∂α
e
∂α
= τ − κ.
∂θ
O termo
∂y
∂ϕ
(18)
é calculado por
∂y ∂α ∂τ
∂α ∂τ
∂y
=
=λ
,
∂ϕ
∂α ∂τ ∂ϕ
∂τ ∂ϕ
(19)
em que
e
O termo
∂y
∂ω
∂α
= θ,
∂τ
(20)
∂τ
= δ − ε.
∂ϕ
(21)
é calculado por
∂y
∂y ∂α ∂κ
∂α ∂κ
=
=λ
,
∂ω
∂α ∂κ ∂ω
∂κ ∂ω
(22)
∂α
= 1 − θ,
∂κ
(23)
em que
∂y
= 1 − λ,
∂β
(26)
(28)
∂τ
= ϕ,
∂δ
(29)
∂δ
Qσ (δ ·1 − (x + a))
=
.
∂a
Qσ (δ ·1 − (x + a)) · 1T
(30)
O termo
∂y
∂b
pode ser calculado por:
∂y ∂α ∂τ ∂ε
∂τ ∂ε
∂y
=
= λθ
,
∂b
∂α ∂τ ∂ε ∂b
∂ε ∂b
(31)
∂τ
= 1 − ϕ,
∂ε
(32)
Qσ (ε ·1 − (x + b))
∂ε
=
.
∂b
Qσ (ε ·1 − (x + b)) · 1T
(33)
em que
e
(16)
(17)
(25)
∂y ∂α ∂τ ∂δ
∂τ ∂δ
∂y
=
= λθ
,
∂a
∂α ∂τ ∂δ ∂a
∂δ ∂a
O termo
em que
∂y ∂β
∂y
=
,
∂p
∂β ∂p
em que
e
(15)
é calculado por
∂β
= x,
(27)
∂p
em que x representa o m-ésimo padrão de treinamento.
∂y
pode ser calculado por:
O termo ∂a
∂y
= α − β.
∂λ
(24)
e
(13)
∂y ∂y ∂y ∂y ∂y ∂y ∂y ∂y ∂y
,
,
,
,
,
,
,
,
∂λ ∂θ ∂ϕ ∂ω ∂p ∂a ∂b ∂c ∂d
(14)
∂y
O termo ∂λ
é calculado por
∂y
=
∂w
∂y
∂p
onde
em que
∂κ
= δ − ε.
∂ω
∂y
∂c
pode ser calculado por:
∂y ∂α ∂κ ∂δ
∂κ ∂δ
∂y
=
= λ(1 − θ)
,
∂c
∂α ∂κ ∂δ ∂c
∂δ ∂c
em que
∂κ
= ω,
∂δ
e
Qσ δ ·1 − (x∗ + c)
∂δ
=
.
∂c
Qσ δ ·1 − (x∗ + c) · 1T
O termo
∂y
∂d
(34)
(35)
(36)
pode ser calculado por:
∂y ∂α ∂κ ∂ε
∂κ ∂ε
∂y
=
= λ(1 − θ)
,
∂d
∂α ∂κ ∂ε ∂d
∂ε ∂d
em que
∂κ
= 1 − ω,
∂ε
e
∂ε
Qσ (ε ·1 − (x∗ + d))
=
.
∂d
Qσ (ε ·1 − (x∗ + d)) · 1T
(37)
(38)
(39)
Vale mencionar a função de impulso suave
Qσ (x) = [qσ (x1 ), qσ (x2 ), . . . , qσ (xn )], é dada por
1 xi 2
qσ (xi ) = exp
, ∀ i = 1, . . . , n . (40)
2 σ
Resultados Experimentais
A série temporal BBDC4 foi normalizada no intervalo [0, 1] e dividida em três conjuntos: treinamento (50% dos dados), validação (25% dos
dados) e teste (25% dos dados). Vale mencionar que o procedimento de ajuste de fase (phase
fix procedure, PFP) (Ferreira et al., 2008) foi utilizado diretamente no processo de aprendizagem
para ajustar distorções de fase temporais caracterı́sticas em fenômenos temporais financeiros. As
seguintes medidas foram utilizadas para avaliar o
desempenho preditivo (Ferreira et al., 2008): erro
médio percentual absoluto (MAPE), estatı́stica u
de theil (THEIL) e previsão de mudança na direção (POCID).
Para realização dos experimentos com o modelo proposto, é necessário definir uma arquitetura básica, dada pela notação IDLN (lags;μ;σ),
em que lags define os retardos temporais utilizados para representar o fenômeno temporal, μ representa a taxa de aprendizagem, e σ representa
o fator de escala da função de impulso suave. A
escolha dos retardos temporais foi baseada na análise da série, onde foram fixados os retardos temporais 2 até 1001 (lags = 2 − 1001) para todos
os experimentos. Também, vale mencionar que o
primeiro retardo temporal não é utilizado porque
é necessário se criar uma estrutura de passeio aleatório para a utilização do PFP.
O valor de μ é determinado empiricamente
através de uma série de experimentos, onde foi
escolhido o valor 0.1. O valor de σ também é determinado empiricamente através de uma série de
experimentos, onde foi escolhido o valor 0.5. Os
valores iniciais do vetor de pesos do modelo IDLN
são: a, b, c, d, p ∈ [−1, 1] e λ, θ, ϕ, ω ∈ [0, 1].
No processo de treinamento do IDLN três condições de parada são utilizadas: i) quantidade máxima de épocas de treinamento (104 ), ii) P t ≤
10−6 , e iii) Gl ≥ 5%. Todos os experimentos com
o modelo IDLN foram desenvolvidos e implementados utilizando a ferramenta Matlab. Por fim,
para cada arquitetura investigada, são realizados
cinquenta experimentos, onde são calculadas as estatı́sticas básicas: média (MEAN), mediana (MEDIAN), raiz do erro quadrático médio (root mean
square, RMS), percentis 2.5% (PERC25) e 97.5%
(PERC975), valor mı́nimo (MIN) e valor máximo
(MAX).
4.1
Tabela 1: Desempenho preditivo para a série
BBDC4 (conjunto de teste).
Modelo
RW
IDLN
Estatı́stica
MEAN
RMS
MEDIAN
PERC25
PERC975
MIN
MAX
MEAN
RMS
MEDIAN
PERC25
PERC975
MIN
MAX
MAPE
1,7489e-02
1,7489e-02
1,7489e-02
1,7489e-02
1,7489e-02
1,7489e-02
1,7489e-02
5,0647e-04
6,2933e-04
4,0259e-04
1,3423e-04
1,6069e-03
1,3027e-04
2,4647e-03
Medida
POCID
78,34
78,34
78,34
78,34
78,34
78,34
78,34
100,00
100,00
100,00
100,00
100,00
100,00
100,00
THEIL
1,0000e+00
1,0000e+00
1,0000e+00
1,0000e+00
1,0000e+00
1,0000e+00
1,0000e+00
6,0567e-04
1,4405e-03
2,4876e-04
2,8119e-05
4,2500e-03
2,6201e-05
9,0313e-03
Tabela 2: Resultados do teste de Wilcoxon.
IDLN
p-valor
3,3111e-20
2,6280e-23
3,3111e-20
Medida
MAPE
POCID
THEIL
/ RW
h
1,0000e+00
1,0000e+00
1,0000e+00
sideram a rejeição da hipótese nula a 5% de nı́vel
de significância, para todas as medidas investigadas. Neste contexto, o teste de Wilcoxon revela
que o modelo proposto tem desempenho preditivo estatı́sticamente superior a um passeio aleatório. A Figura 6 apresenta um gráfico comparativo
entre os valores reais da série e os valores preditos pelo modelo proposto, considerando os últimos
dez pontos do conjunto de teste da série temporal
BBDC4.
BBDC4
36.44
36.43
36.42
36.41
36.4
Preço
4
36.39
36.38
36.37
36.36
Valores Reais
IDLN
RW
36.35
1
2
3
4
5
6
Observações
7
8
9
10
Figura 6: Resultados de previsão da série BBDC4
(últimos dez pontos do conjunto de teste).
BBDC4
A Tabela 1 apresenta os resultados alcançados
pelo modelo proposto (IDLN) e por um passeio
aleatório (RW) para a série BBDC4.
De acordo com a Tabela 1, é possı́vel verificar
que, para todas as medidas investigadas, o modelo
proposto obteve resultados superiores a um passeio aleatório. A Tabela 2 apresenta os p-valor e o
teste de decisão (h), para todas as medidas investigadas, do teste não-paramétrico de Wilcoxon.
Os resultados apresentados na Tabela 2 con-
5
Conclusões
Este trabalho apresentou um estudo sobre previsão de séries temporais financeiras, em altafrequência. Neste contexto, foi utilizada a série
do Bradesco SA (BBDC4), referente aos preços de
abertura, com frequência de 01 segundo. A análise do lagplot desta série nos permitiu levantar a
suposição da existência de uma componente dominante linear presente em retardos temporais de
baixa ordem. Esta suposição foi confirmada pelo
decaimento hiperbólico encontrado nas funções de
autocorrelação e autocorrelação parcial, onde foi
possı́vel identificar altas correlações em retardos
de baixa ordem e baixas correlações em retardos
de alta ordem. Também, o lagplot permitiu levantar a suposição da existência de uma componente
sub-dominante não-linear em retardos temporais
de alta ordem. A confirmação desta suposição foi
baseada na informação mútua média, que revelou
a existência de uma dependência não-linear na série. Por fim, o parâmetro de Hurst revelou que
o fenômeno gerador da série é um processo autosimilar com dependência de longo prazo (com caracterı́sticas anti-persistentes), confirmando a suposição que séries financeiras, em alta-frequência,
não são geradas por processo aleatório.
Baseado neste estudo, este trabalho apresentou um modelo previsão para séries temporais financeiras, em alta-frequência, que atenda a todos
estas caracterı́sticas. Para o processo de aprendizagem, foi desenvolvido um método baseado em
gradiente descendente utilizando ideias do algoritmo de retropropagação do erro. Os resultados
alcançados mostraram que, para todas as métricas
investigadas, o modelo proposto possui desempenho preditivo estatisticamente superior a um passeio aleatório, isto é, o modelo proposto foi capaz
de superar o dilema.
Como trabalhos futuros pretende-se investigar outras séries temporais financeiras, em altafrequência, para confirmação dos resultados alcançados neste trabalho, bem como pretende-se
investigar o desempenho de modelos clássicos de
previsão financeira para o caso particular em altafrequência.
Referências
Aghamohammadi, C., Ebrahimian, M. e Tahmooresi, H. (2014). Permutation approach,
high frequency trading and variety of micro
patterns in financial time series, Physica A
413: 25–30.
Chavez-Demoulin, V. e McGill, J. A. (2012).
High-frequency financial data modeling using
hawkes processes, Journal of Banking & Finance 36: 3415–3426.
Ferreira, T. A. E., Vasconcelos, G. C. e Adeodato,
P. J. L. (2008). A new intelligent system
methodology for time series forecasting with
artificial neural networks, Neural Processing
Letters, Vol. 28, pp. 113–129.
Fraser, A. e Swinney, H. (1986). Independent coordinates for strange atractors from mutual
information, Physical Review A 33(2): 1134–
1140.
Haykin, S. (1998). Neural networks: A comprehensive foundation, Prentice Hall, New
Jersey.
Hurst, E. (1951). Long term storage capacity of
reservoirs, Transactions of the American Society of Civil Engenieers 116: 770–799.
Jabbur, E., Silva, E., Castilho, D., Pereira, A. e
Brandao, H. (2014). Design and evaluation
of automatic agents for stock market intraday trading, International Joint Conferences
on Web Intelligence and Intelligent Agent Technologies .
Kantz, H. e Schreiber, T. (2003). Nonlinear Time
Series analysis, second edn, Cambridge University Press, New York, NY, USA.
Kraskov, A., Stgbauer, H. e Grassberger, P.
(2004). A new auto-associative memory based on lattice algebra, Phys. Rev. E 69(6).
Lean, H. H., Mishra, V. e Smyth, R. (2015). The
relevance of heteroskedasticity and structural
breaks when testing for a random walk with
high-frequency financial data: Evidence from
asean stock markets, The Handbook of High
Frequency Trading pp. 59–73.
Aldridge, I. (2013). High-frequency trading: a
practical guide to algorithmic strategies and
trading systems, John Wiley & Sons.
Menezes, J. M. P., Barreto, G. A. e Freire, A. L.
(2009). Redes neurais recorrentes para predição recursiva de séries temporais caóticas:
Um estudo comparativo, Congresso Brasileiro de Redes Neurais Artificiais .
Anagnostidis, P. e Emmanouilides, C. J. (2015).
Nonlinearity in high-frequency stock returns:
Evidence from the athens stock exchange,
Physica A 421: 473–487.
Ortega, L. e Khashanah, K. (2014). A neurowavelet model for the short-term forecasting
of high-frequency time series of stock returns,
Journal of Forecasting 33: 134–146.
Box, G. E. P., Jenkins, G. M. e Reinsel, G. C.
(1994). Time Series Analysis: Forecasting
and Control, third edn, Prentice Hall, New
Jersey.
Silva, E., Castilho, D., Pereira, A. e Brandao, H.
(2014). A neural network based approach
to support the market making strategies in
high-frequency trading, International Joint
Conference on Neural Networks .
Caporale, G. M. e Gil-Alana, L. A. (2013). Long
memory and fractional integration in high
frequency data on the us dollar-british pound
spot exchange rate, International Review of
Financial Analysis 29: 1–9.
Sun, E. W. e Meinl, T. (2012). A new waveletbased denoising algorithm for high-frequency
financial data mining, European Journal of
Operational Research 217: 589–599.