MODELOS DE PREVISÃO PARA DADOS DE ALTA FREQÜÊNCIA: UM ESTUDO COMPARATIVO UTILIZANDO OS MODELOS DE REDES NEURAIS E ARIMA PARA O CASO DO PREÇO FUTURO DO AÇÚCAR. [email protected] Apresentação Oral-Comercialização, Mercados e Preços RICARDO CHAVES LIMA1; AMANDA AIRES VIEIRA2; VITOR GONÇALVES CAVALCANTI3; DIEGO LINS MOTA4; ABDIAS SILVA NETO5. 1,2.UFPE, OLINDA - PE - BRASIL; 3,4,5.PRAEDIX, RECIFE - PE - BRASIL. Modelos de previsão para dados de alta freqüência: Um estudo comparativo utilizando os modelos de redes neurais e ARIMA para o caso do preço futuro do açúcar. Grupo de Pesquisa: COMERCIALIZAÇÃO, MERCADO E PREÇOS Resumo Esse trabalho objetiva prever os preços futuros do açúcar. Para tanto, utilizou-se as metodologia Arima e de redes neurais. Os resultados apontam que a metodologia de redes neurais se aplicam melhor para horizontes mais distantes, o que vai de acordo com a literatura, enquanto o modelo ARIMA deve ser utilizado para horizontes mais curtos de tempo. Palavras-chaves: Preço do açúcar, modelos ARIMA, modelos de Redes neurais Abstract This paper aims to make forecastings of the future prices of sugar. In order to do it, we utilized the ARIMA and Neural Networks methodology. The results tell that the neural networks methodology can be used in long time horizons, what is in accordance to the literature. The ARIMA model must be utilized in shorter time horizons. Key Words: Sugar prices, ARIMA, Neural networks 1. Introdução O Brasil possui, atualmente, a maior participação no mercado mundial do açúcar. Com participação de 19,9% na produção mundial e 38,8% nas exportações globais (Silva Jardim, 2006, apud Melo 2009.), o país se destaca pelo seu peso no mercado mundial dessa commodity. No Brasil, os preços futuros do açúcar, assim como de outras commodities, são estabelecidos diariamente através dos contratos realizados na Bolsa de Mercadorias e Futuros – BM&F. Após consolidados os contratos, que têm prazos variados, os preços futuros se igualam ao preço spot, obedecendo, desta forma, a lei do preço único. Dada a sua grande importância para a economia nacional, a análise da variação no preço do açúcar e a previsão do mesmo se tornam fundamentais na decisão sobre 1 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural produção. Considerando o estabelecimento diário do preço do açúcar, esse preço pode ser caracterizado como um dado de alta freqüência. Muitos modelos de previsão, como filtro de dados, modelos GARCH e modelos de redes neurais, são utilizados para prever a variação de dados de alta freqüência e, embora Alexander (2001) afirme que o modelo ARIMA não deve ser aplicado em análise de dados de alta freqüência sugerindo outros modelos, esse artigo visa analisar o seu desempenho frente ao modelo de redes neurais. Desta forma, o presente artigo é dividido em cinco partes, incluindo a presente introdução. Na segunda parte, é realizada uma sucinta análise sobre os modelos ARIMA e de redes neurais, para esse último, considerou os avanços da literatura no desenvolvimento do mesmo. Em seguida, dois modelos empíricos são apresentados para a análise de dados de alta freqüência. A quarta seção apresenta os resultados dos modelos de previsão e a última e quinta parte traz as conclusões. 2. Modelos de previsão para dados de alta freqüência: Uma revisão de literatura 2.1. O modelo de redes neurais De acordo com PORTUGAL e FERNANDES (1996), o método das redes neurais se baseia no estudo da estrutura do cérebro humano para tentar copiar sua forma inteligente de processar informação. De acordo com RUMELHART (1986, apud PORTUGAL e FERNANDES, 1996), o modelo de redes neurais (conexionista) pode ser explicado por oito elementos principais: • • • • • • • • Um conjunto de unidades de processamento; Um estado de ativação; Uma função saída; Um padrão de interconexão; Uma regra de propagação; Uma regra de ativação; Uma regra de aprendizado; Um ambiente onde o sistema deve funcionar. 1. As unidades de processamento Correspondem ao componente básico da rede neural. Elas são comumente denominadas de neurônios. Cada neurônio da rede tem o papel de calcular um estado de ativação, que é um valor numérico de saída do neurônio. O conjunto destas unidades, em si, forma a rede neural. 2. Estado de ativação O conjunto dos estados de ativação de cada neurônio forma o estado de ativação de toda a rede, que é alterado ao longo do tempo de acordo com o que é representado na rede. Os valores de ativação podem ser discretos ou contínuos. Por exemplo, para valores discretos, a rede poderia produzir os 2 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural valores {0,1} ou, para valores contínuos, a rede poderia produzir valores no intervalo [0,1]. O cálculo desses valores é feito pelo que é chamado de regra de ativação. 3. Função de Saída As conexões entre os neurônios acontecem através dos seus valores que são transmitidos pelas conexões. Este valor é determinado pela ativação do neurônio estimulador. A função de saída pode ser a função de identidade, isto é, o sinal de saída é igual ao estado de ativação. Em muitos casos, a função de saída é uma função porteira (patamar, limiar) que só emite sinal quando o seu estado ultrapassa certo limite. 4. Padrão de Interconexão O padrão de interconexão é representado pelo conjunto dos valores que um neurônio tem sobre um outro. As ligações podem ser positivas, quando o neurônio de influência reforça a ativação do neurônio que recebe a ligação, ou negativas, quando o neurônio de influência inibe a ativação do neurônio que recebe a ligação. A estrutura de uma rede neural é descrita como um sistema composto por várias camadas de unidades de processamentos. O modelo de Perceptrons Multi-Camadas é composto por três camadas. A figura abaixo apresenta um exemplo da estrutura desse modelo. Figura 1: exemplo de um modelo de rede neural do tipo Perceptrons Multi-Camadas Fonte: Elaboração própria. 3 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural A rede neural apresentada na figura acima é composta por dois neurônios de entrada (E1 e E2), cinco neurônios intermediários (I1, I2, I3, I4 e I5) e um neurônio de saída (S). Nesse caso, os padrões de interconexões são representados pelas linhas contínuas. Em algumas redes neurais, os neurônios de entrada possuem ligações diretas com o neurônio de saída. Embora a figura acima apresente apenas as ligações intercamadas, é possível também existir conexões intra-camadas nesses modelos, em que neurônios de uma mesma camada possuem conexões. 5. Regra de Propagação O cálculo da nova ativação de um neurônio é feito com base em uma regra de propagação. Essa regra pode ser definida como sendo uma função somatório da entrada líquida dos pesos dos neurônios uj que se conectam com o neurônio ui . 6. Regra de ativação O valor de ativação de um neurônio em um dado momento é calculado de acordo com uma regra. Essa é descrita por uma função de ativação, também conhecida como função limiar. Assim como foi descrito no Estado de Ativação, os valores dos neurônios de entrada são redimensionados em um intervalo de saída pré-determinado. As quatro funções mais utilizadas são sigmóide, linear, rampa e degrau. 7. Regra de aprendizado Segundo o autor, existem vários tipos de regras de aprendizado adotadas para os modelos de redes neurais. De maneira geral, as regras de aprendizado são responsáveis em determinar os pesos das conexões das redes. 8. Ambiente onde o sistema deverá funcionar Ao trabalhar com o modelo de redes neurais, deve-se especificar o ambiente onde a rede deve funcionar. Isso é feito estabelecendo os possíveis padrões de entrada e saída que se quer trabalhar. Ao longo do tempo, vários pesquisadores contribuíram para o desenvolvimento das redes neurais. Muitos modelos, com diferentes aspectos e estruturas, foram criados para diferentes fins. Para cada finalidade, como, por exemplo, o reconhecimento de sons, imagens e previsão de valores, um determinado modelo é indicado. Esse trabalho não se dedicará ao estudo e análise de cada um desses modelos, mas fará uma breve explanação a respeito do modelo Perceptrons Multi-Camadas (Retropropagação), que é indicado para a previsão de dados em série. Esss modelo utiliza uma topologia de três ou mais camadas. De acordo com CORRAR, PAULO E DIAS FILHO (2007 ), “aprender”, para uma rede neural, significa passar por um processo onde os neurônios armazenam as características dos dados de entrada. A regra mais utilizada para o treinamento da rede neural Perceptron Multi-Camadas é a Regra do Delta Generalizado ou o Algoritmo de Retro-Propagação. De acordo com BARNDORFF-NIELSEN, JENSEN e KENDALL 4 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural (1993) essa regra foi aparentemente descoberta por Bryson e Ho (1969) e Werbos (1974), contudo, foi redescoberta e popularizada por Rumelhart, Hinton e Williams (1986). 2.2. O modelo Auto-regressivo Integrado de Média Móvel (ARIMA) e metodologia Box-Jenkis. Os modelos Auto-regressivos Integrados de Médias Móveis – ARIMA – se originam da união do Modelo ARMA (auto-regressivos de médias móveis) à metodologia de Box-Jenkis. A constituição do modelo ARIMA é sugerida por possibilitar a análise de séries estacionárias, que possuem média, variância, e covariância constantes. Ou seja, esse modelo, dadas as propriedades constantes da série, possui melhor capacidade de ajuste para previsão. Para tanto, a integração do Modelo ARMA é realizada caso a série não seja estacionária. Nesse caso, diferencia-se a série quantas vezes forem necessárias para obter a estacionariedade da mesma. Ao utilizar o operador diferença no processo, obtém-se o Modelo ARIMA. Para fazer previsões utilizando o modelo ARIMA em uma série temporal, necessita-se determinar a ordem dos parâmetros. Uma série temporal não-estacionária homogênea pode ser representada por um modelo ARIMA (p,d,q), em que p é a ordem do modelo de auto-regressão, d é o grau de homogeneidade da série e q é a ordem do modelo de média móvel. O primeiro passo no modelo ARIMA é descobrir quantas vezes a série precisa ser diferenciada para se tornar estacionária, ou seja, precisa-se definir o grau de homogeneidade da série (d). A ordem auto-regressiva do modelo (p) e a do processo de média móvel (q) são determinadas pela análise da Função de Autocorrelação da série estudada. Dentro da metodologia Box-Jenkins, testa-se a estacionariedade da série utilizando os seguintes testes: Dickey-Fuller Aumentado (ADF) e o teste de Phillips-Perron. A hipótese nula do teste ADF afirma que a série possui raiz unitária, ou seja, a mesma é nãoestacionária. O ADF segue uma distribuição própria, conhecida como estatística τ (tau). Algumas séries podem apresentar quebra estrutural, viesando o teste ADF a não rejeitar a hipótese nula (Enders, 2004). Uma alternativa é utilizar o teste de Phillips-Perron que faz uso das mesmas hipóteses do teste ADF para verificar a presença de raiz unitária, e que também testa a presença de quebra estrutural tanto de nível, como de outlier. A estatística do teste de Phillips-Perron segue a distribuição t-student. Outra abordagem para o estudo da estacionaridade de uma determinada série parte da análise de sua função de autocorrelação (FAC). A FAC indica qual o nível de correlação entre pontos subseqüentes da série estudada (Pindyck e Rubinfeld, 2004). Para uma série estacionária o gráfico da FAC declina rapidamente com relação ao eixo das defasagens. 3. Aspectos Metodológicos e apresentação dos modelos 3.1. Origem dos dados 5 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural Para o presente estudo, foram utilizados os dados referentes aos preços futuros do açúcar cristal adquiridos da Bolsa de Mercadorias e Futuros – BM&F. A periodicidade é de 03 de janeiro de 2000 a 06 de fevereiro de 2009, totalizando 2.271 observações. 3.2. Modelo de previsão 1: Modelos de Redes Neurais O modelo de redes neurais utilizado é composto por quatro neurônios de entrada, dez neurônios intermediários e apenas um neurônio de saída. Os dados de entrada e de saída dessa rede são os valores referentes aos preços do açúcar comercializados no mercado de futuros. Os dados de entrada, utilizados para prevê os valores dos preços seguintes, são os quatro últimos preços de cada determinado período. Cada um desses preços defasados é incluso na rede através dos neurônios de entrada. Nessa rede também foram utilizadas conexões diretas entre os neurônios de entrada e o neurônio de saída. Com relação à quantidade de camadas existentes na rede neural, esse está de acordo com o que é recomendado por alguns autores especialistas no assunto. De acordo com CORRAR, PAULO e DIAS FILHO (2007), para aplicações mais usuais na área de negócios, uma rede neural deve possui apenas uma única camada intermediária. Porém a quantidade de neurônios foi estipulada através da experimentação de algumas redes para esta série. Na fase de treinamento, a rede neural conseguiu um bom ajustamento com a série de preço, conforme observamos na figura abaixo. 25.0 22.5 20.0 17.5 15.0 12.5 10.0 7.5 5.0 250 500 750 1000 1250 1500 1750 2000 2250 Série dos preços e o ajustam ento da rede neural Figura 2: Série dos preços e o ajustamento da rede neural Fonte de dados: BM&F, 2009 (elaboração própria) 3.3. Modelo de previsão 2: Modelos Auto-Regressivos Integrados de Média Móvel (ARIMA) 6 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural Na estimação dos dados com o modelo ARIMA, aplicou-se o teste Dickey-Fuller Aumentado (ADF) e o teste de Phillips-Perron, obtendo-se os resultados apresentados na Tabela 3.1. Tabela 3.1.: Resultado dos testes ADF e Perron Testes Estatística 1% 5% 10% Hipótese nula ADF -1,3822 -3,43 -2,86 -2,57 Não rejeitada Perron -3,4955 -5,57 -5,08 -4,82 Não rejeitada Fonte: Elaboração Própria Conclusão Não-estacionária Não-estacionária Para a análise em tela, o nível de signifcância adotado foi de 5%. Os resultados dos testes confirmaram que a série, mesmo em logaritmo natural, não é estacionária. O teste de Perron também demonstrou que a série não possui quebra estrutural. Como o modelo de Box-Jenkins trabalha apenas com séries estacionárias, houve a necessidade de uma diferenciação para estudarmos a série. A partir da diferenciação da série em logaritmo, aplicamos novamente os testes ADF e Perron: Tabela 3.2.: Resultados dos testes ADF e Perron Testes Estatística 1% 5% 10% Hipótese nula ADF -43,869 -3,43 -2,86 -2,57 Rejeitada Perron -13,000 -5,57 -5,08 -4,82 Rejeitada Fonte: Elaboração Própria Conclusão Estacionária Estacionária Desta feita, os testes demonstraram que a série, ao tornar-se estacionária com uma diferenciação, pode ser trabalhada com a metodologia Box-Jenkins. Utilizou-se a série em logaritmos para atenuar a volatilidade da mesma. A figura 3 apresenta tanto os dados absolutos quanto os linearizados, em que os dados plotados na parte superior do gráfico dizem respeito à série original enquanto os dados da parte inferior (em azul) se referem à série em logaritmo natural. 25 20 15 10 5 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 Figura 3: Volatilidade dos preços do açúcar em valores absolutos e linearizados 7 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural Fonte de dados: BM&F, 2009 (elaboração própria) A figura 4 mostra a série após a linearização. Através desse gráfico, é possível observar uma forte diminuição na variação entre os dados da série: 2 1 0 -1 -2 -3 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 Figura 4: Apresentação da série linearizada de dados de preço do açúcar cristal. Fonte de dados: BM&F, 2009 (elaboração própria) Após os ajustes no processo de previsão, o modelo que mais se aproximou do desejado foi AR(||1,4||). 4. Resultados Após analisados os modelos empíricos de previsão, o presente artigo estimou três modelos distintos de previsão: Previsão ex-ante para três pontos, para seis e para dozes dias. As tabelas abaixo mostram os resultados obtidos. Tabela 4.1.: Previsões para três pontos à frente, utilizando modelos de redes neurais Dado Previsões três passos Valor Previsões um passo a Valor a frente observado frente observado 2268 16,62863309587 16,75 16,62863309587 16,75 2269 16,73285323801 16,75 16,78264767544 16,75 2270 16,87008988068 16,80 16,90747526102 16,80 EQM EQM 0,00664550941 0,009115576 Fonte: Elaboração Própria 8 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural Tabela 4.2.: Previsões para três pontos à frente, utilizando ARIMA Dado Previsões três passos a Valor Previsões um passo a frente observado frente 2268 16,78921882162 16,75 16,78921882162 2269 16,78543228668 16,75 16,74347942504 2270 16,79387023731 16,80 16,75868379160 EQM EQM 0,000943712 0,001095888 Fonte: Elaboração Própria Valor observado 16,75 16,75 16,80 Tabela 4.3.: Previsões para seis pontos à frente, utilizando modelos de redes neurais Dado Previsões seis passos a Valor Previsões um passo a Valor frente observado frente observado 2265 16,36545071944 16,00 16,36545071944 16,00 2266 16,48969940353 16,20 16,33609927663 16,20 2267 16,58978494033 16,75 16,37422814880 16,75 2268 16,70133401047 16,75 16,62863309587 16,75 2269 16,82463025780 16,75 16,78264767544 16,75 2270 16,93767659698 16,80 16,90747526102 16,80 EQM EQM 0,02250347811 0,026719038 Fonte: Elaboração Própria Tabela 4.4.: Previsões para seis pontos à frente, utilizando ARIMA Dado Previsões seis passos a Valor Previsões um passo a frente observado frente 2265 16,18156660225 16,00 16,18156660225 2266 16,19652274117 16,20 16,00202545773 2267 16,19545673845 16,75 16,21192092926 2268 16,19538238840 16,75 16,78921882162 2269 16,19670984057 16,75 16,74347942504 2270 16,19743296650 16,80 16,75868379160 EQM EQM 0,219552413 0,060829517 Fonte: Elaboração Própria Valor observado 16,00 16,20 16,75 16,75 16,75 16,80 9 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural Tabela 4.5.: Previsões para doze pontos à frente, utilizando modelos de redes neurais Dado Previsões doze passos a Valor Previsões um passo a Valor frente observado frente observado 2259 15,42768261910 15,40 15,4276826191 15,40 2260 15,55649523453 15,18 15,5443392230 15,18 2261 15,67204695240 15,90 15,4993690657 15,90 2262 15,78896530054 16,20 15,7814798498 16,20 2263 15,89865742635 16,15 16,0623951244 16,15 2264 16,01731917656 16,15 16,2201838159 16,15 2265 16,13549612024 16,00 16,3654507194 16,00 2266 16,25393895612 16,20 16,3360992766 16,20 2267 16,37215842051 16,75 16,3742281488 16,75 2268 16,49071439382 16,75 16,6286330959 16,75 2269 16,60846570353 16,75 16,7826476754 16,75 2270 16,72508022839 16,80 16,9074752610 16,80 EQM EQM 0,058425935 0,066866875 Fonte: Elaboração Própria Tabela 4.6.: Previsões para doze pontos à frente, utilizando ARIMA Dado Previsões doze passos a Valor Previsões um passo a frente observado frente 2259 15,43037721380 15,40 15,43037721380 2260 15,44549902323 15,18 15,41295278890 2261 15,45168609451 15,90 15,16975088185 2262 15,45974189390 16,20 15,95886601489 2263 15,46158287520 16,15 16,22116182574 2264 15,46234685430 16,15 16,13672842136 2265 15,46266001300 16,00 16,18156660225 2266 15,46302000510 16,20 16,00202545773 2267 15,46312239442 16,75 16,21192092926 2268 15,46316159906 16,75 16,78921882162 2269 15,46317747566 16,75 16,74347942504 2270 15,46319368757 16,80 16,75868379160 EQM EQM 0,779500755 0,084734699 Valor observado 15,40 15,18 15,90 16,20 16,15 16,15 16,00 16,20 16,75 16,75 16,75 16,80 Através dos resultados podemos perceber que para os modelos redes neurais, as previsões realizadas com três observações à frente, seis observações à frente e doze observações à frente possuem um EQM menor do que as previsões para o mesmo número de previsões, sendo utilizada a metodologia one step-ahead. 10 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural O modelo ARIMA mostra que existe uma propensão para que as previsões realizadas com a metodologia one step-ahead possuam um EQM menor do que as previsões realizadas com 3, 6 e 12 observações à frente. Com uma ressalva à comparação realizada para três dados, em que houve quase um empate entre os dois ajustamentos, porém sendo calculado um menor o EQM das previsões de três passos à frente em detrimento as previsões one step-ahead. Os resultados encontrados para as previsões ex-post de três observações à frente, seis observações frente e doze observações frente e das previsões 3,6 e 12 observações one step-ahead, através do cálculo do erro quadrado médio (EQM), mostram que o poder de previsão do modelo ARIMA para o espaço temporal de curto prazo em uma série com pouca volatilidade é melhor do que o ajustamento do modelo de Redes Neurais. Enquanto para um horizonte de previsão maior e em séries ou períodos de tempo com maior volatilidade o modelo de redes neurais possui um melhor poder preditivo. 5. Conclusões O mercado de açúcar possui uma grande importância para a economia nacional e, sobremaneira pra a economia nordestina. O presente artigo buscou observar qual modelo de previsão possuiria maior poder preditivo para o preço futuro do açúcar, utilizando, para esse fim, o modelo de redes neurais e o modelo ARIMA. Os resultados apontam que para definir qual o método deve-se utilizar para prever o valor do preço do contrato do açúcar no futuro, é necessário definir o horizonte de tempo que da previsão, além de observar se o cenário apresenta perspectiva de grandes oscilações, ou seja, se a série terá um alto grau de volatilidade. Podemos observar, através da comparação do erro quadrado médio das previsões ex-post, que o modelo de redes neurais apresentou desempenho superior ao do modelo ARIMA. Isto mostra que o modelo de redes neurais, de fato, é um importante instrumento de análise na ciência econômica. Contudo, também deve-se observar que o modelo ARIMA não deve ser desconsiderado na previsão de valores. Esse modelo continua sendo um importante instrumento para a previsão de valores na economia. Isso é visto na análise do erro quadrado médio das previsões três passos à frente. Porém, de acordo com os erros quadrado médio das previsões ex-post, podemos concluir que para a série de preços do açúcar comercializados no mercado de futuros da BM&F, o modelo de redes neurais tem se apresentado, nos últimos tempos, um instrumento de previsão de preços superior ao modelo ARIMA. 6. Referências Bibliográficas Enders, W., 1996. Rats Handbook for Econometric Times Series Gujarati, D., 2000, Econometria Básica 3ª ed., MAKROW Books, São Paulo. 11 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural Melo, A., 2009. Uma análise da relação entre a expansão dos biocombustíveis e as culturas alimentares no Brasil: o caso do setor sucroalcooleiro. Dissertação de Mestrado. UFPE. Portugal, M., Fernandes, L., 2000. Redes Neurais Artificiais e Previsão de Séries Econômicas: Uma Introdução Smith, M., 1996, Neural Networks for Statistical Modeling Johnston, J; e Dinardo, J., 2001, Métodos Econométricos. Corrar, J., Paulo, E., Dias Filho, E., 2007, Análise Multivariada: para os cursos de administração, ciências contábeis e economia 12 Porto Alegre, 26 a 30 de julho de 2009, Sociedade Brasileira de Economia, Administração e Sociologia Rural