57ª Reunião Anual da RBras – 05 a 09 de maio de 2012 Modelagem do total de passageiros transportados no aeroporto internacional de Belém: Um estudo preliminar Núbia da Silva Batista ¹ Cássio Pinho dos Reis ² Flávia Ferreira Batista ²3 1 Introdução Inaugurado em 1959 e ampliado em 2001, inclusive servindo de exemplo padrão pela sua administradora Empresa Brasileira de Infra-Estrutura Aeroportuária (INFRAERO), que administra 67 aeroportos brasileiros, o Aeroporto Internacional de Belém - Julio Cezar Ribeiro, no estado do Pará é um dos mais movimentados da Região Norte, sendo o 16º mais movimentado do país. O complexo do aeroporto possui uma área de 5,6 milhões m², com duas pistas de pousos de 2,8 e 1,8 km de extensão e um terminal de passageiros de 33 mil m². Atualmente, seis companhias aéreas nacionais e 2 internacionais, além de 3 companhias exclusivamente cargueiras operam no aeroporto, com mais de 70 vôos diários para diversas cidades. De acordo com a sua administradora INFRAERO, a capacidade anual do aeroporto é de 2.700.000 passageiros, porém no ano de 2011, esse número foi ultrapassado, fazendo com que o aeroporto de Belém entrasse na lista dos aeroportos saturados brasileiros, ou seja, operando acima da sua capacidade. Por conta disto, o objetivo do presente trabalho é descrever o comportamento da série histórica do total de passageiros nacionais e internacionais transportados no aeroporto internacional de Belém, encontrando um modelo matemático que seja capaz de prever esses valores para os próximos períodos. 2 Material e Métodos Os dados apresentados são obtidos através de formulários próprios preenchidos pelas companhias aéreas e enviadas, por meio eletrônico ou não, a cada aeroporto da rede INFRAERO. Depois esses dados são tratados e armazenados em um banco único na Sede. O conjunto de dados ______________________________ ¹ [email protected], Pós-Graduação em Logística e Pesquisa Operacional, UFC. ² [email protected], Pós-Graduação em Estatística Aplicada e Biometria, UFV. ² [email protected], Pós-Graduação em Estatística Aplicada e Biometria, UFV. 3 Agradecimento a FAPEMIG e CAPES pelo apoio financeiro. 1 57ª Reunião Anual da RBras – 05 a 09 de maio de 2012 utilizados é correspondente a soma do quantitativo de passageiros embarcados mais desembarcados, ou seja, a soma dos passageiros de origem, destino e conexões transportados em vôos regulares e com existência no Horário de Transporte Aéreo (HOTRAN) no Brasil, para este estudo temos observações de janeiro de 2003 a dezembro de 2011, totalizando 108 observações. Na figura 1.1 temos o gráfico da série do total de passageiros transportados (linha preta), percebemos uma tendência positiva (linha azul), e a presença da sazonalidade (linha vermelha). Série do Total de Passageiros Transportados Figura 1.1 Histórico do Total de Passageiros Transportados Nacionais e Internacionais do Brasil Para o estudo desta série de dados será utilizada a metodologia de Box & Jenkins, tendo como objetivo principal a realização de previsões, eles generalizam o modelo ARIMA para lidar com a sazonalidade, criando o modelo ARIMA sazonal multiplicativo, conhecido como SARIMA, dado por φ ( B ) Φ ( B S )Wt = θ ( B ) Θ ( B S ) ε t , de ordem ( p, d , q ) × ( P, D, Q ) s . (MORETTIN; TOLOI, 2004) Segundo Ehlers (2009) para tornar a identificação e estimação do modelo sazonal mais fácil, tomar a primeira diferença apenas não é suficiente para tornar a série estacionária, sendo assim é apropriado em séries com sazonalidade, tomar diferenças no período sazonal. 3 Resultados As estatísticas descritivas mostram que a menor quantidade de passageiros transportados no Brasil foi de 82.040 e a maior foi 302.879, com uma média de 165.554 e desvio padrão de 51.206, o valor da assimetria indica uma leve assimetria à direita. A partir do teste de normalidade Shapiro-Wilk, com estatística 0,9671 e p-valor 0,008937, verificamos a não-normalidade dos dados, pois rejeita-se a hipótese nula de normalidade dos dados ao nível de significância de 1%. Com o intuito de solucionar a não-normalidade foi realizada a transformação de BoxCox, onde o valor de λ igual a zero está contido no intervalo de confiança de 95%, sendo 2 57ª Reunião Anual da RBras – 05 a 09 de maio de 2012 assim podemos aplicar a transformação logarítmica aos dados. Agora com os dados transformados, estes atendem os pressupostos de normalidade, e feito o teste Shapiro-Wilk não se rejeita a hipótese nula de normalidade dos dados para um alfa de 1%, pois p-valor é igual a 0,03305. É possível notar a não estacionariedade da série no gráfico da série (Figura 1.1), sendo confirmada pelo teste de Dickey-Fuller, com estatística -2,7193 e p-valor 0,2783, onde a hipótese nula de não estacionariedade não é rejeitada para qualquer alfa menor que 27%. Então na tentativa de tornar a série estacionária, é necessário tomar uma diferença. A Figura 1.1 apresenta os gráficos das funções de autocorrelação e autocorrelação parcial da série com uma diferença simples, uma diferença sazonal e com as duas diferenças, pode-se observar que a série dá a opção de um modelo preliminar do tipo, SARIMA(0,1,1)x(1,1,1)12. Figura 1.1 Gráfico da fac e facp para ∆, ∆12 e ∆∆12 Obtendo as estimativas do modelo: ( ) ˆ ) = 0,1200 σˆ ( Φ ˆ ) = 0, 2489 σˆ ( Θ σˆ θˆ1 = 0,1521 θˆ1 = −0,1832 ˆ = −0, 0201 ; Φ 1 ˆ Θ = −0,9999 1 1 1 σˆ 2 = 0, 002842 ; AIC = −254, 72 A Figura 1.3 mostra o gráfico do diagnóstico dos resíduos do modelo preliminar proposto, observa-se que a fac corresponde bem ao esperado, e os p-valores do teste de independência dos resíduos estão sempre acima do limite estabelecido, com o teste Shapiro- 3 57ª Reunião Anual da RBras – 05 a 09 de maio de 2012 Wilk, estatística 0,9843 e p-valor 0,2344, é confirmada a normalidade dos resíduos (Tabela 1.4). Figura 1.6 Gráfico de diagnóstico do modelo Os valores preditos constam na Figura 1.7, observa-se que aparentemente o ajuste foi bom. Na tabela abaixo temos os valores preditos. Tabela 1.5 Valores preditos Meses Jan/2012 Fev/2012 Mar/2012 Abr/2012 Mai/2012 Jun/2012 Preditos 276.973,9 244.113,2 260.703,9 270.404,2 264.032,0 266.852,7 Erro Padrão 15.260,10 17.756,37 18.005,14 18.250,51 18.492,64 18.731,63 Meses Jul/2012 Ago/2012 Set/2012 Out/2012 Nov/2012 Dez/2012 Preditos 294.904,0 277.935,3 273.158,4 279.572,2 278.143,8 283.735,5 Erro Padrão 18.967,61 19.200,69 19.430,98 19.658,57 19.883,55 20.106,01 4 Conclusões O objetivo do presente trabalho foi descrever o comportamento da série histórica do total de passageiros nacionais e internacionais transportados no aeroporto internacional de Belém, encontrando um modelo matemático que seja capaz de prever esses valores para os próximos períodos. Na análise, foi feito uma transformação de variáveis de Box-Cox, pois inicialmente, os dados não pertenciam à distribuição normal de probabilidade. Posteriormente, foi verificado a não estacionariedade da série, e, portanto, tomou-se uma diferença, além da diferença sazonal feita. Portanto, o modelo escolhido é o SARIMA(0,1,1)x(1,1,1)12, cujo modelo passou por todos os diagnósticos de validação. 4 57ª Reunião Anual da RBras – 05 a 09 de maio de 2012 Na análise, foi feito uma transformação de variáveis de Box-Cox, pois inicialmente, os dados não pertenciam à distribuição normal de probabilidade. Posteriormente, foi verificado a não estacionariedade da série, e, portanto, tomou-se uma diferença, além da diferença sazonal feita. Portanto, o modelo escolhido é o SARIMA(0,1,1)x(1,1,1)12, cujo modelo passou por todos os diagnósticos de validação. Série e Valores Previstos Figura 1.7 Gráfico da série do total de passageiros e previsão do modelo ajustado De acordo com os resultados obtidos pelo modelo, pode-se observar pelos valores preditos para os meses de 2012, que a movimentação de passageiros do aeroporto internacional de Belém será de 3.270.530. Um acréscimo de 9,22% em relação à movimentação de 2011, acima da capacidade do aeroporto que é de 2.700.000 Referências [1] EHLERS, R. S. Análise de séries temporais. 2009. Disponível em <http://www.icmc.usp.br/~ehlers/stemp/stemp.pdf>. Acesso em: nov. 2011. [2] MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. São Paulo, Edgard Blucher LTDA, 2004. [3] R DEVELOPMENT CORE TEAM (2011). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-070, URL http://www.R-project.org/. 5