XXII Encontro Nacional de Engenharia de Produção Curitiba – PR, 23 a 25 de outubro de 2002 PREVISÃO DE FATURAMENTO NO VAREJO BRASILEIRO UTILIZANDO-SE DE UM MODELO DE REDES NEURAIS ARTIFICIAIS Marcelo Botelho da Costa Moraes Faculdade de Economia, Administração e Contabilidade – Universidade de São Paulo Av. dos Bandeirantes, 3900 – CEP 14040-900 Ribeirão Preto – SP Marcelo Seido Nagano Faculdade de Economia, Administração e Contabilidade – Universidade de São Paulo Av. dos Bandeirantes, 3900 – CEP 14040-900 Ribeirão Preto – SP Edgard Monforte Merlo Faculdade de Economia, Administração e Contabilidade – Universidade de São Paulo Av. dos Bandeirantes, 3900 – CEP 14040-900 Ribeirão Preto – SP Abstract Artificial Neural Network (ANN) is one of the most utilized tools for pattern recognition and prediction in business. ANN demonstrates good results in several business applications. In this paper, a new application was developed to predict revenue in the Brazilian retail market utilizing five different variables: gross income, check out numbers, sales area, store number and employee number. Multi-layer perceptron (MLP) model with backpropagation algorithm combination was the most popular method used. Revenue is very important to determine the strategic planning and determine company performance. The results obtained were very good, showing a lower divergence between the desired responses and the obtained. Thus, ANN has proved great capacity to correlate input variables to determine the output with a low error. Keywords: Neural Networks, Forecasting, Retail 1. Introdução Segundo Levy & Weitz (2000), “varejista é um negociante que vende produtos e serviços de uso pessoal e familiar aos consumidores, é o último negociante de um canal de distribuição que liga fabricantes a consumidores, entretanto os varejistas direcionam seus esforços para satisfazer as necessidades dos consumidores finais”. De acordo com Berman & Evans (1998), além de satisfazer os consumidores, os varejistas têm adicionalmente três objetivos. O primeiro objetivo está relacionado a vendas, quanto maior a venda maior o market share, estabilidade e crescimento do varejista. O segundo objetivo é a lucratividade e o terceiro é a imagem, posicionamento, que envolve criar e manter uma imagem apropriada para o tipo de negócio em questão. Levy & Weitz (2000) afirmam que para ser bem sucedido o varejista deve focar seu gerenciamento para atender a necessidade de seu público alvo mais eficientemente que seus concorrentes, um bom meio de se fazer isso é através de produtos diferenciados ou exclusivos. Essa afirmação é especialmente importante para o segmento de supermercados, onde a concorrência tem se acentuado com a chegada dos grandes grupos internacionais. ENEGEP 2002 ABEPRO 1 XXII Encontro Nacional de Engenharia de Produção Curitiba – PR, 23 a 25 de outubro de 2002 O movimento de concentração do segmento de varejo introduz um aspecto interessante a ser observado que é o desenvolvimento de uma vantagem competitiva sustentável que conforme Porter (1999) pode ocorrer através de três estratégias básicas: a busca de um custo mais baixo que a concorrência, o oferecimento de um produto diferenciado e finalmente uma estratégia de enfoque, onde selecionada uma parcela do mercado esta é atendida com custos muitos baixos ou diferenciação acentuada dos produtos. O problema colocado por vários autores é que além da obtenção da vantagem competitiva sua mensuração é de difícil execução, posto que uma série de variáveis devem ser observadas. Neste sentido, de acordo com Buzzell e Gale (1987) não há dúvidas de que a participação no mercado e o retorno sobre o investimento estão fortemente relacionados. As empresas que gozam de fortes posições competitivas nos mercados de seus produtos principais tendem a ser altamente rentáveis. E sugere alguns fatores de posição competitiva e estratégia como: Participação no mercado, qualidade de produtos e serviços, pesquisa e desenvolvimento, marketing, valor agregado ao produto e vendas, ativo imobilizado, produtividade inclusive da mão de obra, avaliação e taxas de utilização dos estoques. Normalmente estas variáveis são de difícil observação e mensuração, pois existem problemas de coleta e confiabilidade dos dados disponíveis. O estudo realizado pretende demonstrar a potencialidade do mecanismo de redes neurais como ferramenta de previsão de desempenho futuro das empresas de varejo do segmento de supermercados no Brasil. 2. Redes Neurais Artificiais As Redes Neurais Artificiais tiveram suas origens em 1911 com o trabalho de Ramón y Cajál que introduziram a idéia do neurônio como sendo a unidade básica de processamento do cérebro humano e a rede neural como um conjunto de diversos neurônios conectados formando a mente humana (HAYKIN, 1994). Mais tarde, McCulloch e Pitts modelaram matematicamente o funcionamento desses neurônios e seus relacionamentos em rede, criando as bases da neurocomputação e das Redes Neurais Artificiais – RNA’s (HERTZ et al., 1991). Apesar da modelagem teórica, o desenvolvimento das RNA’s não ocorreu de forma continua devido a problemas operacionais, pois nesta época ainda não haviam sido criados computadores com tamanho poder de processamento, além da falta de difusão e compreensão sobre o funcionamento das redes neurais biológicas. 2.1. O Neurônio Artificial O modelo, baseado na neuroanatomia, simula artificialmente as conexões entre os neurônios, dispostos em uma rede, onde cada unidade computacional (neurônio) recebe uma série de entradas e as combina, gerando uma nova entrada a uma série de neurônios posteriores até a saída final da rede, que deve ser a resposta final ao problema. Desenvolvido em 1943 por McCulloch e Pitts o perceptron é um modelo matemático do funcionamento de um neurônio biológico. Assim, o neurônio pode ser definido pelo seguinte modelo (figura 1): ENEGEP 2002 ABEPRO 2 XXII Encontro Nacional de Engenharia de Produção Curitiba – PR, 23 a 25 de outubro de 2002 Sinais de entrada X1 X2 X3 . . . Xn w1 Função Transferência w2 w3 . . . Σ T yj Saída wn Função Soma(sj) Pesos e Conexões Figura 1 – Modelo de um neurônio artificial Cada neurônio (j) é numerado e indexado, numa analogia ao neurônio biológico apresenta diversas entradas (dendritos), potencializadas pelos respectivos pesos wj (conexões sinápticas) e com a função soma simulando a captação do estímulo recebidos, acumulando de maneira ponderada os sinais recebidos pelo neurônio em sj: n s j = ∑ xi w ji i =1 A partir do valor da soma ponderada, a função de transferência (T) utiliza-se de um limiar θ para determinar a saída yj : 1 s j ≥ θ y j = f (s j ) = 0 s j < θ Onde a saída yj é determinada pela função f(sj), normalmente uma função sigmóide, como por exemplo, a função logística (HAYKIN, 1994). Assim, a saída gerada pelo neurônio será 1 se a soma ponderada for superior ou igual a θ e 0 se inferior. Onde pode-se comparar θ ao limiar de ativação presente nos neurônios biológicos. O potencial de ação de um neurônio biológico acontece ou não, dependendo da grandeza do estímulo que é aplicado a ele. O limiar é definido como o valor mínimo do potencial de membrana em que vai ocorrer o potencial de ação. Todos os valores de potencial de membrana inferiores ao valor necessário para a produção de um potencial de ação são ditos subliminares. Caso um estímulo não consiga deslocar o potencial de membrana até o valor limiar, a resposta parcial, subliminar, desaparece. No neurônio artificial, temos uma situação semelhante, cujo limiar de disparo é operado pela função de transferência. 2.2. Estrutura da Rede As RNA’s são formadas por inúmeros neurônios diferentes dispostos de maneiras a proporcionar um melhor desempenho ao objetivo da rede. A disposição dos neurônios em diferentes camadas e a variação entre suas conexões de entradas e saídas formam a arquitetura, ou estrutura da rede. Entre as diversas estruturas existentes optou-se pelo uso das redes MLP (Multi Layer Perceptron) propostas pro McCulloch e Pitts e feedforward, redes onde os sinais fluem das unidades de entrada para as unidades de saída, em direção sempre adiante (FAUSETT, 1994). ENEGEP 2002 ABEPRO 3 XXII Encontro Nacional de Engenharia de Produção Curitiba – PR, 23 a 25 de outubro de 2002 Neurônios de Saída Pesos Entradas Saídas Neurônios Escondidos Figura 2 – Estrutura de RNA feedforward de duas camadas As redes feedforward são caracterizadas pela organização dos neurônios em camadas, na sua forma mais simples a rede projeta os sinais de entrada diretamente para a camada de neurônios de saída, sendo esta camada simultaneamente de entrada e saída, pois a entrada não é considerada uma camada por não apresentar nenhuma forma de processamento. As redes multicamadas apresentam duas ou mais camadas (Figura 2) e se diferenciam por apresentarem camadas extras de neurônios. A função destes neurônios é intervir entre a entrada externa e a saída da rede. Pela adição de uma ou mais camadas ocultas, a rede se torna apta a extrair relações de alta categoria, proporcionando uma perspectiva generalizada à rede (HAYKIN, 1994). 2.3. Treinamento da Rede O aprendizado é um processo pelo qual parâmetros livres de uma rede neural são adaptados através de um contínuo processo de estimulo pelo ambiente em que a rede se encontra. O tipo de aprendizado é determinado pela maneira como os parâmetros, ou pesos das conexões, são atualizados (HAYKIN, 1994). Um dos mais utilizados algoritmos de aprendizado é o backpropagation (retro propagação), onde os pesos das conexões entre os neurônios são atualizados no sentido de minimizar o erro: ek ( n ) = d k ( n ) − y k ( n ) O erro (ek) é calculado pela subtração do valor esperado (yk) do valor obtido (dk) e a atualização dos pesos flui de maneira inversa, através da equação (backpropagation): ∆wkj (n) = η ek (n) x j (n) Em que a variação do peso da conexão w entre os neurônios j e k é o resultado, η é uma constante positiva que determina a taxa de aprendizagem, e a taxa de erro e x o valor de entrada do neurônio subseqüente, todos em determinado tempo (n). 2.4. Aplicações das RNA’s Na área de negócios as aplicações das redes neurais são recentes, na década de 80, principalmente se comparadas aos primeiros estudos em neuroanotomia, que datam da década de 50. Dentre as principais aplicações desenvolvidas em redes neurais e suas publicações nas principais revistas científicas da área, pode-se encontrar a maior utilização das redes neurais em seis áreas: Finanças, Contabilidade/Auditoria, Recursos Humanos, Marketing/Distribuição, Sistemas de Informações, Produção/Operações e Outras (MORAES & NAGANO, 2001). As redes neurais artificiais apresentam como seu grande atributo a detecção de padrões não lineares por meio do aprendizado, incluindo dados históricos (YAO et al., ENEGEP 2002 ABEPRO 4 XXII Encontro Nacional de Engenharia de Produção Curitiba – PR, 23 a 25 de outubro de 2002 2000). Assim, suas principais aplicações estão relacionadas à caracterização/análise e previsões, baseadas em séries temporais de determinados padrões de ocorrências que auxiliam a rede na resolução do problema objetivo. As respostas geradas pelas previsões realizadas pelas RNA’s geralmente apresentam melhores resultados em comparação a métodos de previsão tradicionais, tais como métodos de regressão linear, as RNA’s podem ser utilizadas como alternativas a estes métodos para incrementar sua precisão em previsões (SHI et al., 1999). 3. Experimentação Redes neurais têm sido demonstradas como uma ferramenta promissora para previsão de séries temporais financeiras, tendo como principais fatores de desempenho a metodologia de seu desenvolvimento (WALCZAK, 2001). Para a realização da previsão do faturamento de supermercados utilizou-se como base de dados as informações contidas no ranking anual dos 300 maiores supermercados da Associação Brasileira de Supermercados (ABRAS), existentes para os anos de 1991 até 2000. Devido à ocorrência de mudanças de moedas foram utilizados os dados a partir de 1994. Para a utilização de um modelo de redes neurais para estes sete anos foram encontradas 31 ocorrências de supermercados que compuseram a lista da ABRAS de 1994 a 2000 simultaneamente. Dentro das informações disponíveis foram selecionadas: Faturamento Bruto: valor expresso em reais (R$) para cada ano; Número de Check-Outs: número de caixas existentes em toda a rede de determinado supermercado; Área de Vendas: área total destinada a vendas correspondente a toda a rede; Número de Lojas: número total de lojas em funcionamento da rede; Número de Funcionários: o número total de funcionários contratados pela rede. Para um modelo de previsão como este são necessárias entradas da rede que são dados do passado e a saída, que é o valor previsto (ZHANG et al., 2001). Neste caso o período estabelecido é anual, com seis valores – referentes a 1994, 1995, 1996, 1997, 1998 e 1999 – para a previsão do faturamento no ano de 2000. Uma das decisões mais críticas, principalmente em casos de previsão, é determinar a arquitetura apropriada, o número de camadas, os neurônios em cada camada e as conexões entre estes neurônios. Para tanto foram desenvolvidas 31 redes diferentes, uma para cada supermercado. Por uma questão metodológica de padronização e comparação dos resultados o mesmo modelo foi utilizado para todas as ocorrências: Camada de Saída Sinais de Entrada Saída Camada Oculta Camada de Entrada Figura 3 – RNA desenvolvida para Previsão de Faturamento de Supermercados ENEGEP 2002 ABEPRO 5 XXII Encontro Nacional de Engenharia de Produção Curitiba – PR, 23 a 25 de outubro de 2002 A estrutura utilizada no modelo (Figura 3) se baseia no modelo MLP (Multi Layer Perceptron) e feedforward, conforme apresentada anteriormente, é composta da entrada de dados, além de duas camadas, com três neurônios na camada oculta e um único neurônio na camada de saída, que corresponde ao valor de faturamento previsto. O número de camadas e neurônios possui fundamental importância para o reconhecimento do padrão dos dados, fica claro que sem uma camada oculta, um simples perceptron com uma saída linear se torna equivalente a modelos estatísticos lineares preditivos (ZHANG et al., 1998). Redes com duas camadas (oculta e de saída) são capazes de prover mais vantagens para a maior parte dos problemas, não se tornando necessárias camadas adicionais. Para o treinamento, deve-se ressaltar que não existe um algoritmo corrente disponível para garantir uma solução global ótima ou que resolva um problema de otimização não linear em tempo razoável, por isso optou-se pelo algoritmo backpropagation – essencialmente baseado no método do gradiente descendente – que é um dos mais utilizados. Os resultados obtidos na previsão do faturamento dos supermercados estão demonstrados nas seguintes tabelas: Erro Relativo FATUR (Obtido) T. FATUR (Esperado) (Absoluto) Supermercado A. ANGELONI & CIA LTDA. ABC ALIMENTOS A BAIXO CUSTO LTDA. A DAHER & CIA. LTDA. CABRINI BERETTA & CIA. LTDA. CARREFOUR COM. IND. LTDA. CARVALHO & FERNANDES LTDA. CATRICALA & CIA. LTDA. CENTRAL COM. IMP. LTDA. CIA. APOLO DE SUPERMERCADOS COMPANHIA BRASILEIRA DE DISTRIBUIÇÃO CIA. ZAFFARI COMÉRCIO E INDÚSTRIA COMERCIAL CESA S/A COMERCIAL TATIANA S/A COFESA COMERCIAL FERREIRA SANTOS S/A CEREALISTA MARANHÃO LTDA. CS AVENIDA COM. IMP. LTDA. CS PRINCIPAL LTDA DE CARLI S/A SUPERMERCADOS G. BARBOSA & CIA LTDA. INDUSTRIAL MOAGEIRA LTDA. IRMÃOS BOA LTDA. IRMÃOS RUSSI LTDA. JAD ZOGHEIB & CIA. LTDA. J. MARTINS SUPERMERC. PLANALTO LTDA. KUSMA & CIA. LTDA. L. C. BONATO E CIA LTDA. LEMBRASUL SUPERMERCADOS LTDA. LOJAS POPULARES LTDA. LUIZ TONIN & CIA. LTDA. TISCHLER & CIA. LTDA. SUPERMERCADO RISPOLI LTDA. 409.700.000 51.690.000 37.270.000 32.130.000 8.104.000.000 144.700.000 35.020.000 46.790.000 23.250.000 9.572.000.000 743.300.000 61.010.000 58.200.000 95.620.000 26.390.000 112.100.000 28.000.000 18.540.000 573.900.000 18.230.000 20.570.000 195.800.000 84.440.000 32.530.000 25.020.000 18.420.000 82.520.000 37.740.000 44.550.000 40.650.000 43.980.000 483.400.000 -73.730.000 57.460.000 -5.767.317 41.900.000 -4.630.927 36.100.000 -3.968.023 9.520.000.000 -1.416.000.000 151.700.000 -6.983.878 38.060.000 -3.043.545 45.840.000 948.598 25.370.000 -2.121.395 9.550.000.000 21.870.000 754.600.000 -11.300.000 67.290.000 -6.282.916 69.520.000 -11.320.000 99.550.000 -3.933.340 31.640.000 -5.245.370 99.720.000 12.360.000 27.020.000 984.034 18.360.000 175.271 629.000.000 -55.090.000 18.980.000 -745.709 26.830.000 -6.263.243 241.500.000 -45.690.000 98.870.000 -14.430.000 38.650.000 -6.122.932 30.110.000 -5.094.159 18.430.000 -12.436 74.100.000 8.422.810 44.370.000 -6.632.236 61.320.000 -16.770.000 42.700.000 -2.051.865 35.870.000 8.108.069 Erro Médio Relativo (%) % Erro Relativo 15,25 10,04 11,05 10,99 14,87 4,60 8,00 2,07 8,36 0,23 1,50 9,34 16,28 3,95 16,58 12,39 3,64 0,95 8,76 3,93 23,34 18,92 14,59 15,84 16,92 0,07 11,37 14,95 27,35 4,81 22,60 10,76 Tabela 1 – Resultados das RNA’s para previsão de faturamento ENEGEP 2002 ABEPRO 6 XXII Encontro Nacional de Engenharia de Produção Curitiba – PR, 23 a 25 de outubro de 2002 Deve-se ressaltar que o percentual de erro apresentado na tabela não corresponde ao erro de treinamento da rede, mas ao teste de previsão referente ao ano 2000. Além disso, o número de épocas de treinamento foi consideravelmente pequeno bem como a taxa de aprendizado (learning rate), para não comprometer a rede com o viés do overfitting (um supertreinamento). Como cada supermercado possui sua própria rede é possível que novas topologias ou diferentes algoritmos de treinamento possam melhorar o desempenho, minimizando o erro. Assim, cada supermercado possui a sua própria relação entre as variáveis que podem determinar o faturamento. Para medir o desempenho da rede foram determinados os percentuais de erro relativo: | FATUR − T .FATUR | % ERRO = T .FATUR A partir desse resultado pode-se observar que algumas redes obtiveram resultados significativos, como por exemplo, a rede do supermercado COMPANHIA BRASILEIRA DE DISTRIBUIÇÃO com um erro relativo de 0,23%, e outras não tão significantes, como foi o caso da rede do supermercado LUIZ TONI & CIA. LTDA. que apresentou o maior erro relativo, de 27,35%. Uma segunda análise refere-se à tabela abaixo que mostra a capacidade de previsibilidade do modelo desenvolvido com a baixa faixa de erro associada. Faixa de Erro (%) Número de Supermercados 0-5 10 5-10 4 10-15 8 15-20 6 Acima de 20 3 Tabela 2 – Faixa de erro de previsão do modelo Apesar da variação dos percentuais de erro das diversas redes neurais desenvolvidas a média dos erros foi de 10,76%, podendo ser considerada aceitável como resultado global do experimento. 4. Considerações Finais Redes neurais artificiais são modelos não-interpretáveis. Seu conhecimento é codificado em pesos e associado com as conexões da rede. Desvendar as relações de uma rede neural é praticamente inviável, a extração de regras do modelo tem sido pesquisada e se demonstram como uma possível forma de transformar o processo de decisão mais transparente. Apesar disso, os modelos de redes neurais se mostram válidos a utilização em problemas não estruturados. Neste trabalho, com a sua utilização em previsão de faturamento de supermercados o modelo mostra-se apto, com uma média de erro relativo de aproximadamente 10%, sendo considerada satisfatória. O estudo desenvolvido demonstrou ser um eficiente modelo de previsão de faturamento nas redes varejistas. Esta afirmação é ainda mais relevante se considerarmos que no período analisado ocorreram grandes mudanças no cenário competitivo do varejo brasileiro e o percentual de erro ainda assim foi reduzido. Assim, o modelo pode auxiliar tanto as cadeias varejistas como ao mercado na previsão do faturamento anual de cada rede de supermercados, ajudando no planejamento estratégico da empresa e na análise de seu desempenho. ENEGEP 2002 ABEPRO 7 XXII Encontro Nacional de Engenharia de Produção Curitiba – PR, 23 a 25 de outubro de 2002 Bibliografia BERMAN, B., EVANS, J. R. Retail Management: a strategic approach. USA: PrenticeHall, 1998. BUZZEL, R. D., GALE, B. T. Tha PIMS Principles Linking Strategy to Performance. Macmillan, Inc., 1987. FAUSETT, L. Fundamentals of Neural Networks: architetures, algorithms, and applications. USA: Prentice-Hall, 1994. HAYKIN, S. Neural Networks: a comprehensive foundation. USA: Prentice-Hall, 1994. HERTZ., J., KROGH, A. and PALMER, R.G. Introduction to the Theory of Neural Computation. USA: Addison-Wesley Publishing Company, 1991. LEVY M., WEITZ, B. A. Adminsitração de Varejo. São Paulo: Atlas, 2000. MORAES, M. B. C. e NAGANO, M. S. Redes Neurais Artificiais em Negócios: conceitos e aplicações. São Paulo: 1o Seminário USP de Contabilidade, 2001, p. 1-16. PORTER, M. E. Competição On Competition: Estratégias Competitivas essenciais. Rio de Janeiro: Campus, 1999. SHI, S. H., XU, L. D. and BA, L. Improving the accuracy of nonlinear combined forecasting using neural networks. USA: Expert System with Applications, 1999, Vol. 16 p. 49-54. WALCZAK, S. An Empirical Analysis of Data Requirements for Financial Forecasting with Neural Networks. USA: Journal of Managements System, 2001, Vol. 17 p. 203-222. YAO, J., LI, Y. and TAN, C. L. Option price forecasting using neural networks. USA: OMEGA – The International Journal of Management Science, 2000, Vol. 28 p. 455-466. ZHANG, G., PATUWO, B. E. and HU, M. Y. Forecasting with artificial neural networks: The state of art. USA: International Journal of Forecasting, 1998, Vol. 14 p. 35-62. ZHANG, G. P., PATUWO, B. E. and HU, M. Y. A simulation study of artificial neural networks for nonlinear time-series forecasting. USA: Computers & Operations Research, 2001, Vol. 28, p. 381-396. ENEGEP 2002 ABEPRO 8