CONTRIBUIÇÕES AO PROBLEMA DE PREVISÃO FINANCEIRA EM ALTA-FREQUÊNCIA USANDO MODELOS MORFOLÓGICOS-LINEARES Ricardo de A. Araújo∗,§ , Adriano L. I. Oliveira∗ , Silvio Meira∗ ∗ § Centro de Informática, Universidade Federal de Pernambuco, Recife, PE, Brasil Departamento de Informática, Instituto Federal do Sertão Pernambucano, Ouricuri, PE, Brasil Email: [email protected] ou {raa,alio,srlm}@cin.ufpe.br Resumo— Este trabalho apresenta um estudo sobre séries financeiras, em alta-frequência, na tentativa de identificar as caracterı́sticas do seu fenômeno gerador e, baseado neste estudo, propor um modelo, com aprendizagem baseada em gradiente descendente, capaz de prevê-las. Além disso, uma análise experimental é conduzida com o modelo proposto, utilizando uma série financeira, em alta-frequência, do mercado de ações brasileiro, onde um conjunto de medidas estatı́sticas são utilizadas para avaliação do desempenho preditivo. Palavras-chave— Modelo de Previsão, Aprendizagem Baseada em Gradiente Descendente, Mercado de Ações em Alta-Frequência, Previsão de Séries Temporais. 1 Introdução O constante desenvolvimento das plataformas eletrônicas de negociação tem aumentado a frequência para realização de operações no mercado de ações para frações de segundos (Ortega e Khashanah, 2014). Este tipo de operação é conhecida como negociação em alta-frequência (highfrequency trading) (Aldridge, 2013) e tem como principal objetivo a operação no mercado de ações, em alta-frequência, sem intervenção humana (Silva et al., 2014). Desde 2009 a BM&F Bovespa (bolsa de valores brasileira) opera em alta-frequência e, de acordo com o relatório anual relativo a 2013 da comissão de valores mobiliários (CVM), o volume total negociado deste tipo de operação cresceu de 0,6% em 2009 para 12% em 2013, bem como o número de negócios cresceu de 2,5% em 2009 para 36,5% em 2013. Vale mencionar que, no mercado de ações americano, o volume total negociado deste tipo de operação já se aproxima dos 80% (Chavez-Demoulin e McGill, 2012), o que leva a crer que o mercado de ações em alta-frequência (high-frequency stock market, HFSM) seja uma tendência global (Aldridge, 2013). Diversos trabalhos foram propostos na literatura relacionados ao HFSM, dentre os quais vale destacar: i) mineração de dados financeiros (Sun e Meinl, 2012), ii) clusterização (Chavez-Demoulin e McGill, 2012), iii) análise de micro padrões (Aghamohammadi et al., 2014), iv) processos de criação de mercados (Jabbur et al., 2014), (Silva et al., 2014), v) análise e previsão de séries temporais (Ortega e Khashanah, 2014), vi) análise de quebras estruturais (Lean et al., 2015), e vii) análise de volatilidade (Anagnostidis e Emmanouilides, 2015). Entretanto, os trabalhos de (Caporale e Gil-Alana, 2013), (Ortega e Khashanah, 2014), (Aghamohammadi et al., 2014) e (Lean et al., 2015) mencionam que, no caso particular da previsão de um-passo-adiante, os modelos de previsão clássicos para séries financeiras, em altafrequência, tendem a seguir o dilema do passeio aleatório (random walk dilemma, RWD). Entretanto, nenhum argumento satisfatório ou prova matemática foram apresentados para suportar tal afirmação, sendo esta baseada apenas em análise empı́rica e, portanto, enfatiza a necessidade de uma análise mais aprofundada deste tipo particular de série temporal. Neste contexto, este trabalho apresenta um estudo sobre as caracterı́sticas do fenômeno gerador de séries financeiras, em alta-frequência e, baseado neste estudo, propor um modelo, composto por uma combinação balanceada entre operadores lineares e operadores não-lineares crescentes e decrescentes, capaz de prever este tipo particular de série temporal. Para o processo de aprendizagem do modelo proposto, é apresentado um método baseado em gradiente descendente. Além disso, uma análise experimental é conduzida com o modelo proposto, utilizando uma série financeira, em alta-frequência, do mercado de ações brasileiro (Bradesco SA - BBDC4), onde um conjunto de medidas estatı́sticas são utilizadas para avaliação do desempenho preditivo. 2 Análise da Série Temporal Esta seção apresenta uma análise da série financeira, em alta-frequência, investigada neste trabalho. 2.1 Bradesco SA (BBDC4) A série temporal BBDC4 utilizada neste trabalho é composta por observações em alta-frequência (01 segundo) do preço de abertura das ações da empresa no dia 01/02/2013, que podem ser ilustradas na Figura 1. De acordo com a Figura 1, é possı́vel verificar que no gráfico da série BBDC4 existe a presença de componentes de tendência de curto prazo com caracterı́sticas crescentes e decrescentes. Note que, não é possı́vel identificar, apenas com a análise gráfica, a presença de componentes sazonais nesta série. BBDC4 36.6 0.8 36.5 0.6 BBDC4 Autocorrelação 36.4 36.3 0.4 0.2 36.2 0 36.1 1000 2000 3000 4000 Observações 5000 6000 7000 Figura 1: Gráfico da série BBDC4. −0.2 0 100 200 300 400 500 600 Retardos Temporais 700 800 900 1000 Figura 3: ACF da série BBDC4. BBDC4 0.8 0.6 Autocorrelação Parcial Devido ao fato do principal problema na caracterização do fenômeno gerador de uma série temporal, além da análise gráfica, ser, naturalmente, a escolha dos retardos temporais (dimensionalidade n), utiliza-se o gráfico lagplot (Kantz e Schreiber, 2003) (apresentado na Figura 2) para determinar e analisar as relações entre os retardos temporais da série BBDC4. 0.4 0.2 0 36.6 36.4 36.4 36.2 36 36.2 36.4 36.6 x(t−25) 36.6 36.4 36.4 36.2 36.2 36 36 36.2 36.4 36.6 x(t−100) x(t) 36.6 36.4 x(t) 36.6 36.4 36.4 x(t) 36.6 36.4 36.2 36 36 36 36.2 36.4 36.6 x(t−500) 36.2 36.4 36.6 x(t−50) 36 36.2 36.4 36.6 x(t−250) 36 36.2 36.4 36.6 x(t−1000) 36 36.2 36.4 36.6 x(t−175) 36.6 36.2 36 36.2 36 x(t) x(t) 36 36 36.6 36 x(t) 36.2 36.4 36.6 x(t−1) 0 100 200 300 400 500 600 Retardos Temporais 700 800 900 1000 36.2 36 36 36.2 36 36 36.2 36.4 36.6 x(t−750) Figura 2: Lagplot da série BBDC4. A partir da análise da Figura 2, é possı́vel verificar a existência de um relacionamento dominante linear entre os retardos temporais de 1 a 25. Entretanto, a partir do incremento da ordem dos retardos temporais (a partir do 50), é possı́vel verificar o aparecimento de uma estrutura não-linear complexa que caracteriza um relacionamento subdominante não-linear que está embutido no relacionamento dominante linear presente em retardos temporais de baixa ordem. Tal fato leva a suposição que o fenômeno gerador de séries temporais financeiras, em alta-frequência, não é construı́do a partir de processos aleatórios, mas por uma combinação balanceada entre um relacionamento dominante linear e um relacionamento sub-dominante não-linear. Neste contexto, ambas as funções de autocorrelação (autocorrelation function, ACF) (Box et al., 1994) e de autocorrelação parcial (partial autocorrelation function, PACF) (Box et al., 1994), ilustradas nas Figuras 3 e 4, respectivamente, são utilizadas para analisar o comportamento da componente dominante linear. Note que, de acordo com as Figuras 3 e 4, as ACF e PACF da série BBDC4 apresentam um caracterı́stico decaimento hiperbólico, o que confirma a suposição da presença de uma forte dependência linear (caracterizado pela componente Figura 4: PACF da série BBDC4. dominante linear encontrado no lagplot ) no fenômeno gerador destas séries, uma vez que é possı́vel verificar altas correlações em retardos temporais de baixa ordem, bem como baixas correlações em retardos temporais de alta ordem. Entretanto, nada se pode observar em relação a natureza da componente não-linear a partir da análise das ACF e PACF, uma vez que de acordo com (Box et al., 1994) estas funções só podem ser utilizadas para análise da dependência linear presente no fenômeno gerador da série temporal. Desta forma, a informação mútua média (mean mutual information, MMI) (Fraser e Swinney, 1986), (Kraskov et al., 2004), ilustrada na Figura 5, é utilizada para se analisar a componente sub-dominante não-linear, uma vez que a MMI representa uma medida de dependência não-linear. BBDC4 3 2.5 Informação Mútua Média 36.2 x(t) 36.6 36.4 x(t) x(t) −0.2 36.6 2 1.5 1 0.5 0 0 100 200 300 400 500 600 Retardos Temporais 700 800 900 1000 Figura 5: MMI da série BBDC4. De acordo com a Figura 5, é possı́vel verificar a existência de dependência não-linear na série BBDC4 (MMI > 0), uma vez que a curva do gráfico se estabiliza, para um valor próximo de 0.8, a partir da dimensionalidade n = 600. Note que, a inexistência de dependência não-linear implicaria em um valor nulo para a MMI. Entretanto, vale mencionar que o gráfico da MMI não possibilita a análise da natureza da dependência não-linear de uma série temporal. Neste contexto, investigou-se o parâmetro de Hurst (Hurst parameter, HP) (Hurst, 1951) para determinar se o fenômeno gerador da série BBDC4 tende a um passeio aleatório (HP= 0.5) ou a um processo auto-similar com dependência de curto (0.5 <HP≤ 1) ou longo (0 ≤HP< 0.5) prazos (Menezes et al., 2009). O HP estimado para a série BBDC4 foi de 0, 1308, o que confirma a suposição que a série em questão é um processo auto-similar com dependência de longo prazo (série anti-persistente – uma tendência crescente no tempo passado é mais provável de se converter em uma tendência decrescente, e vice versa). Além disso, é possı́vel verificar, a partir da Figura 1, que as tendências deste processo autosimilar possuem caracterı́sticas locais com comportamento crescente e decrescente, o que leva a crer que o relacionamento sub-dominante nãolinear presente neste tipo particular de série temporal pode ser aproximado utilizando uma combinação balanceada entre mapeamentos crescentes e decrescentes. Desta forma, este trabalho assume que a série BBDC4 é gerada por xt = xt−1 + g(t) + rt , em que xt−1 representa uma componente dominante linear, g(t) representa uma componente sub-dominante não-linear com comportamento crescente e decrescente, e rt representa um termo de ruı́do gerado por uma distribuição gaussiana com média zero e desvio padrão dado por σ (N (0, σ)). 3 O Modelo Proposto O modelo proposto, referido como neurônio crescente decrescente linear (increasing decreasing linear neuron, IDLN), consiste de uma combinação entre operadores não-lineares crescentes (dilatação e erosão), operadores não-lineares decrescentes (anti-dilatação e anti-erosão) e um operador linear (perceptron linear). A seguir será apresentada a definição formal do IDLN. Seja x = (x1 , x2 , . . . , xn ) ∈ Rn um padrão de entrada, representado pelos retardos temporais de uma série temporal, sobre uma i-ézima janela deslizante, e seja y a saı́da, representada pela previsão, do IDLN, com regra de transformação local do tipo x → y e formalmente definido por y = λα + (1 − λ)β, onde β= n λ ∈ [0, 1], xi pi , (1) (2) i=1 e α = θτ + (1 − θ)κ, θ ∈ [0, 1], (3) e κ = ωδ + (1 − ω)ε, com δ = δa (x) = ε = εb (x) = δ = δ c (x) = ε = εd (x) = ϕ ∈ [0, 1], (4) n (5) (xi + ai ), (6) (xi + bi ), (7) (x∗i + ci ), (8) i=1 n i=1 n i=1 n (x∗i + di ), (9) i=1 onde o termo n representa a dimensionalidade do padrão de entrada (x), os termos λ, θ, ϕ, ω ∈ R, e os termos a, b, c, d, p ∈ Rn . O vetor p representa os coeficientes (pesos) do operador linear. O termo β representa a saı́da do operador linear (módulo linear). O termo α representa o módulo não-linear, dado pela combinação linear (o termo de combinação é dado por θ) entre o módulo nãolinear crescente (definido por τ ) e o módulo nãolinear decrescente (definido por κ). O termo τ representa a combinação linear (o termo de combinação é dado por ϕ) entre o operador morfológico de dilatação (definido por δ) e o operador morfológico de erosão (definido por ε). O termo κ representa a combinação linear (o termo de combinação é dado por ω) entre o operador morfológico de anti-dilatação (definido por δ) e o operador morfológico de anti-erosão (definido por ε). Os vetores a, b, c e d representam, respectivamente, os elementos estruturantes (pesos) dos operadores de dilatação (δa (x)) e erosão (εb (x)) (empregados no módulo não-linear crescente) e de anti-dilatação (δ c (x)) e anti-erosão (εd (x)) (empregados no módulo não-linear decrescente). Note que a saı́da y do IDLN é dada por uma combinação linear entre o modulo linear e o módulo não-linear (o termo de combinação da saı́da do IDLN é dado por λ). 3.1 Processo de Aprendizagem A partir da definição do modelo IDLN, é possı́vel verificar que este requer o ajuste dos parâmetros a, b, c, d, p ∈ Rn e λ, θ, ϕ, ω ∈ R. Portanto, o vetor de pesos w (note que w ∈ R5n+4 ) do modelo IDLN é definido por w = (λ, θ, ϕ, ω, p, a, b, c, d). (10) Na fase de treinamento, os pesos do modelo IDLN são ajustados de acordo com um critério de erro até a convergência, isto é, até o critério de parada ser alcançado. Portanto, é necessário definir uma função objetivo, em termos dos pesos J(w), a ser minimizada durante a fase de treinamento (representada pelo erro de previsão do modelo IDLN utilizando o vetor de pesos w), sendo definida por em que τ = ϕδ + (1 − ϕ)ε, ω ∈ [0, 1], J(w) = M 1 2 e (m), M m=1 (11) onde M representa a quantidade de padrões de treinamento e e(m) representa o erro instantâneo do modelo para o m-ésimo padrão de treinamento. Neste trabalho, um método de gradiente descendente utilizando ideias do algoritmo de retropropagação do erro (back propagation, BP) (Haykin, 1998) é proposto para ajustar o vetor de pesos do modelo. Portanto, o processo de aprendizagem do modelo IDLN consiste na atualização iterativa do vetor de pesos w baseada no método do gradiente descendente. O ajuste do vetor de pesos w para o m-ésimo padrão de treinamento é dado por: w(i + 1) = w(i) − μ∇J(w), (12) em que i ∈ {1, 2, . . .} e o termo μ representa o tamanho do passo de aprendizagem ou taxa de aprendizagem, sendo responsável por regular o equilı́brio entre a estabilidade e velocidade de convergência do processo de aprendizagem do modelo. O termo ∇J(w) é dado pelo gradiente de J em relação a w e dado por ∇J(w) = ∂y ∂J ∂y = −2e(m) , ∂y ∂w ∂w e O termo O termo ∂y ∂θ é calculado por ∂y ∂y ∂α = , ∂θ ∂α ∂θ ∂y = λ, ∂α e ∂α = τ − κ. ∂θ O termo ∂y ∂ϕ (18) é calculado por ∂y ∂α ∂τ ∂α ∂τ ∂y = =λ , ∂ϕ ∂α ∂τ ∂ϕ ∂τ ∂ϕ (19) em que e O termo ∂y ∂ω ∂α = θ, ∂τ (20) ∂τ = δ − ε. ∂ϕ (21) é calculado por ∂y ∂y ∂α ∂κ ∂α ∂κ = =λ , ∂ω ∂α ∂κ ∂ω ∂κ ∂ω (22) ∂α = 1 − θ, ∂κ (23) em que ∂y = 1 − λ, ∂β (26) (28) ∂τ = ϕ, ∂δ (29) ∂δ Qσ (δ ·1 − (x + a)) = . ∂a Qσ (δ ·1 − (x + a)) · 1T (30) O termo ∂y ∂b pode ser calculado por: ∂y ∂α ∂τ ∂ε ∂τ ∂ε ∂y = = λθ , ∂b ∂α ∂τ ∂ε ∂b ∂ε ∂b (31) ∂τ = 1 − ϕ, ∂ε (32) Qσ (ε ·1 − (x + b)) ∂ε = . ∂b Qσ (ε ·1 − (x + b)) · 1T (33) em que e (16) (17) (25) ∂y ∂α ∂τ ∂δ ∂τ ∂δ ∂y = = λθ , ∂a ∂α ∂τ ∂δ ∂a ∂δ ∂a O termo em que ∂y ∂β ∂y = , ∂p ∂β ∂p em que e (15) é calculado por ∂β = x, (27) ∂p em que x representa o m-ésimo padrão de treinamento. ∂y pode ser calculado por: O termo ∂a ∂y = α − β. ∂λ (24) e (13) ∂y ∂y ∂y ∂y ∂y ∂y ∂y ∂y ∂y , , , , , , , , ∂λ ∂θ ∂ϕ ∂ω ∂p ∂a ∂b ∂c ∂d (14) ∂y O termo ∂λ é calculado por ∂y = ∂w ∂y ∂p onde em que ∂κ = δ − ε. ∂ω ∂y ∂c pode ser calculado por: ∂y ∂α ∂κ ∂δ ∂κ ∂δ ∂y = = λ(1 − θ) , ∂c ∂α ∂κ ∂δ ∂c ∂δ ∂c em que ∂κ = ω, ∂δ e Qσ δ ·1 − (x∗ + c) ∂δ = . ∂c Qσ δ ·1 − (x∗ + c) · 1T O termo ∂y ∂d (34) (35) (36) pode ser calculado por: ∂y ∂α ∂κ ∂ε ∂κ ∂ε ∂y = = λ(1 − θ) , ∂d ∂α ∂κ ∂ε ∂d ∂ε ∂d em que ∂κ = 1 − ω, ∂ε e ∂ε Qσ (ε ·1 − (x∗ + d)) = . ∂d Qσ (ε ·1 − (x∗ + d)) · 1T (37) (38) (39) Vale mencionar a função de impulso suave Qσ (x) = [qσ (x1 ), qσ (x2 ), . . . , qσ (xn )], é dada por 1 xi 2 qσ (xi ) = exp , ∀ i = 1, . . . , n . (40) 2 σ Resultados Experimentais A série temporal BBDC4 foi normalizada no intervalo [0, 1] e dividida em três conjuntos: treinamento (50% dos dados), validação (25% dos dados) e teste (25% dos dados). Vale mencionar que o procedimento de ajuste de fase (phase fix procedure, PFP) (Ferreira et al., 2008) foi utilizado diretamente no processo de aprendizagem para ajustar distorções de fase temporais caracterı́sticas em fenômenos temporais financeiros. As seguintes medidas foram utilizadas para avaliar o desempenho preditivo (Ferreira et al., 2008): erro médio percentual absoluto (MAPE), estatı́stica u de theil (THEIL) e previsão de mudança na direção (POCID). Para realização dos experimentos com o modelo proposto, é necessário definir uma arquitetura básica, dada pela notação IDLN (lags;μ;σ), em que lags define os retardos temporais utilizados para representar o fenômeno temporal, μ representa a taxa de aprendizagem, e σ representa o fator de escala da função de impulso suave. A escolha dos retardos temporais foi baseada na análise da série, onde foram fixados os retardos temporais 2 até 1001 (lags = 2 − 1001) para todos os experimentos. Também, vale mencionar que o primeiro retardo temporal não é utilizado porque é necessário se criar uma estrutura de passeio aleatório para a utilização do PFP. O valor de μ é determinado empiricamente através de uma série de experimentos, onde foi escolhido o valor 0.1. O valor de σ também é determinado empiricamente através de uma série de experimentos, onde foi escolhido o valor 0.5. Os valores iniciais do vetor de pesos do modelo IDLN são: a, b, c, d, p ∈ [−1, 1] e λ, θ, ϕ, ω ∈ [0, 1]. No processo de treinamento do IDLN três condições de parada são utilizadas: i) quantidade máxima de épocas de treinamento (104 ), ii) P t ≤ 10−6 , e iii) Gl ≥ 5%. Todos os experimentos com o modelo IDLN foram desenvolvidos e implementados utilizando a ferramenta Matlab. Por fim, para cada arquitetura investigada, são realizados cinquenta experimentos, onde são calculadas as estatı́sticas básicas: média (MEAN), mediana (MEDIAN), raiz do erro quadrático médio (root mean square, RMS), percentis 2.5% (PERC25) e 97.5% (PERC975), valor mı́nimo (MIN) e valor máximo (MAX). 4.1 Tabela 1: Desempenho preditivo para a série BBDC4 (conjunto de teste). Modelo RW IDLN Estatı́stica MEAN RMS MEDIAN PERC25 PERC975 MIN MAX MEAN RMS MEDIAN PERC25 PERC975 MIN MAX MAPE 1,7489e-02 1,7489e-02 1,7489e-02 1,7489e-02 1,7489e-02 1,7489e-02 1,7489e-02 5,0647e-04 6,2933e-04 4,0259e-04 1,3423e-04 1,6069e-03 1,3027e-04 2,4647e-03 Medida POCID 78,34 78,34 78,34 78,34 78,34 78,34 78,34 100,00 100,00 100,00 100,00 100,00 100,00 100,00 THEIL 1,0000e+00 1,0000e+00 1,0000e+00 1,0000e+00 1,0000e+00 1,0000e+00 1,0000e+00 6,0567e-04 1,4405e-03 2,4876e-04 2,8119e-05 4,2500e-03 2,6201e-05 9,0313e-03 Tabela 2: Resultados do teste de Wilcoxon. IDLN p-valor 3,3111e-20 2,6280e-23 3,3111e-20 Medida MAPE POCID THEIL / RW h 1,0000e+00 1,0000e+00 1,0000e+00 sideram a rejeição da hipótese nula a 5% de nı́vel de significância, para todas as medidas investigadas. Neste contexto, o teste de Wilcoxon revela que o modelo proposto tem desempenho preditivo estatı́sticamente superior a um passeio aleatório. A Figura 6 apresenta um gráfico comparativo entre os valores reais da série e os valores preditos pelo modelo proposto, considerando os últimos dez pontos do conjunto de teste da série temporal BBDC4. BBDC4 36.44 36.43 36.42 36.41 36.4 Preço 4 36.39 36.38 36.37 36.36 Valores Reais IDLN RW 36.35 1 2 3 4 5 6 Observações 7 8 9 10 Figura 6: Resultados de previsão da série BBDC4 (últimos dez pontos do conjunto de teste). BBDC4 A Tabela 1 apresenta os resultados alcançados pelo modelo proposto (IDLN) e por um passeio aleatório (RW) para a série BBDC4. De acordo com a Tabela 1, é possı́vel verificar que, para todas as medidas investigadas, o modelo proposto obteve resultados superiores a um passeio aleatório. A Tabela 2 apresenta os p-valor e o teste de decisão (h), para todas as medidas investigadas, do teste não-paramétrico de Wilcoxon. Os resultados apresentados na Tabela 2 con- 5 Conclusões Este trabalho apresentou um estudo sobre previsão de séries temporais financeiras, em altafrequência. Neste contexto, foi utilizada a série do Bradesco SA (BBDC4), referente aos preços de abertura, com frequência de 01 segundo. A análise do lagplot desta série nos permitiu levantar a suposição da existência de uma componente dominante linear presente em retardos temporais de baixa ordem. Esta suposição foi confirmada pelo decaimento hiperbólico encontrado nas funções de autocorrelação e autocorrelação parcial, onde foi possı́vel identificar altas correlações em retardos de baixa ordem e baixas correlações em retardos de alta ordem. Também, o lagplot permitiu levantar a suposição da existência de uma componente sub-dominante não-linear em retardos temporais de alta ordem. A confirmação desta suposição foi baseada na informação mútua média, que revelou a existência de uma dependência não-linear na série. Por fim, o parâmetro de Hurst revelou que o fenômeno gerador da série é um processo autosimilar com dependência de longo prazo (com caracterı́sticas anti-persistentes), confirmando a suposição que séries financeiras, em alta-frequência, não são geradas por processo aleatório. Baseado neste estudo, este trabalho apresentou um modelo previsão para séries temporais financeiras, em alta-frequência, que atenda a todos estas caracterı́sticas. Para o processo de aprendizagem, foi desenvolvido um método baseado em gradiente descendente utilizando ideias do algoritmo de retropropagação do erro. Os resultados alcançados mostraram que, para todas as métricas investigadas, o modelo proposto possui desempenho preditivo estatisticamente superior a um passeio aleatório, isto é, o modelo proposto foi capaz de superar o dilema. Como trabalhos futuros pretende-se investigar outras séries temporais financeiras, em altafrequência, para confirmação dos resultados alcançados neste trabalho, bem como pretende-se investigar o desempenho de modelos clássicos de previsão financeira para o caso particular em altafrequência. Referências Aghamohammadi, C., Ebrahimian, M. e Tahmooresi, H. (2014). Permutation approach, high frequency trading and variety of micro patterns in financial time series, Physica A 413: 25–30. Chavez-Demoulin, V. e McGill, J. A. (2012). High-frequency financial data modeling using hawkes processes, Journal of Banking & Finance 36: 3415–3426. Ferreira, T. A. E., Vasconcelos, G. C. e Adeodato, P. J. L. (2008). A new intelligent system methodology for time series forecasting with artificial neural networks, Neural Processing Letters, Vol. 28, pp. 113–129. Fraser, A. e Swinney, H. (1986). Independent coordinates for strange atractors from mutual information, Physical Review A 33(2): 1134– 1140. Haykin, S. (1998). Neural networks: A comprehensive foundation, Prentice Hall, New Jersey. Hurst, E. (1951). Long term storage capacity of reservoirs, Transactions of the American Society of Civil Engenieers 116: 770–799. Jabbur, E., Silva, E., Castilho, D., Pereira, A. e Brandao, H. (2014). Design and evaluation of automatic agents for stock market intraday trading, International Joint Conferences on Web Intelligence and Intelligent Agent Technologies . Kantz, H. e Schreiber, T. (2003). Nonlinear Time Series analysis, second edn, Cambridge University Press, New York, NY, USA. Kraskov, A., Stgbauer, H. e Grassberger, P. (2004). A new auto-associative memory based on lattice algebra, Phys. Rev. E 69(6). Lean, H. H., Mishra, V. e Smyth, R. (2015). The relevance of heteroskedasticity and structural breaks when testing for a random walk with high-frequency financial data: Evidence from asean stock markets, The Handbook of High Frequency Trading pp. 59–73. Aldridge, I. (2013). High-frequency trading: a practical guide to algorithmic strategies and trading systems, John Wiley & Sons. Menezes, J. M. P., Barreto, G. A. e Freire, A. L. (2009). Redes neurais recorrentes para predição recursiva de séries temporais caóticas: Um estudo comparativo, Congresso Brasileiro de Redes Neurais Artificiais . Anagnostidis, P. e Emmanouilides, C. J. (2015). Nonlinearity in high-frequency stock returns: Evidence from the athens stock exchange, Physica A 421: 473–487. Ortega, L. e Khashanah, K. (2014). A neurowavelet model for the short-term forecasting of high-frequency time series of stock returns, Journal of Forecasting 33: 134–146. Box, G. E. P., Jenkins, G. M. e Reinsel, G. C. (1994). Time Series Analysis: Forecasting and Control, third edn, Prentice Hall, New Jersey. Silva, E., Castilho, D., Pereira, A. e Brandao, H. (2014). A neural network based approach to support the market making strategies in high-frequency trading, International Joint Conference on Neural Networks . Caporale, G. M. e Gil-Alana, L. A. (2013). Long memory and fractional integration in high frequency data on the us dollar-british pound spot exchange rate, International Review of Financial Analysis 29: 1–9. Sun, E. W. e Meinl, T. (2012). A new waveletbased denoising algorithm for high-frequency financial data mining, European Journal of Operational Research 217: 589–599.