XXII Encontro Nacional de Engenharia de Produção
Curitiba – PR, 23 a 25 de outubro de 2002
PREVISÃO DE FATURAMENTO NO VAREJO BRASILEIRO
UTILIZANDO-SE DE UM MODELO DE REDES NEURAIS
ARTIFICIAIS
Marcelo Botelho da Costa Moraes
Faculdade de Economia, Administração e Contabilidade – Universidade de São Paulo
Av. dos Bandeirantes, 3900 – CEP 14040-900 Ribeirão Preto – SP
Marcelo Seido Nagano
Faculdade de Economia, Administração e Contabilidade – Universidade de São Paulo
Av. dos Bandeirantes, 3900 – CEP 14040-900 Ribeirão Preto – SP
Edgard Monforte Merlo
Faculdade de Economia, Administração e Contabilidade – Universidade de São Paulo
Av. dos Bandeirantes, 3900 – CEP 14040-900 Ribeirão Preto – SP
Abstract
Artificial Neural Network (ANN) is one of the most utilized tools for pattern
recognition and prediction in business. ANN demonstrates good results in several business
applications.
In this paper, a new application was developed to predict revenue in the Brazilian
retail market utilizing five different variables: gross income, check out numbers, sales
area, store number and employee number. Multi-layer perceptron (MLP) model with
backpropagation algorithm combination was the most popular method used.
Revenue is very important to determine the strategic planning and determine
company performance. The results obtained were very good, showing a lower divergence
between the desired responses and the obtained. Thus, ANN has proved great capacity to
correlate input variables to determine the output with a low error.
Keywords: Neural Networks, Forecasting, Retail
1. Introdução
Segundo Levy & Weitz (2000), “varejista é um negociante que vende produtos e
serviços de uso pessoal e familiar aos consumidores, é o último negociante de um canal de
distribuição que liga fabricantes a consumidores, entretanto os varejistas direcionam seus
esforços para satisfazer as necessidades dos consumidores finais”.
De acordo com Berman & Evans (1998), além de satisfazer os consumidores, os
varejistas têm adicionalmente três objetivos. O primeiro objetivo está relacionado a
vendas, quanto maior a venda maior o market share, estabilidade e crescimento do
varejista. O segundo objetivo é a lucratividade e o terceiro é a imagem, posicionamento,
que envolve criar e manter uma imagem apropriada para o tipo de negócio em questão.
Levy & Weitz (2000) afirmam que para ser bem sucedido o varejista deve focar seu
gerenciamento para atender a necessidade de seu público alvo mais eficientemente que
seus concorrentes, um bom meio de se fazer isso é através de produtos diferenciados ou
exclusivos. Essa afirmação é especialmente importante para o segmento de supermercados,
onde a concorrência tem se acentuado com a chegada dos grandes grupos internacionais.
ENEGEP 2002
ABEPRO
1
XXII Encontro Nacional de Engenharia de Produção
Curitiba – PR, 23 a 25 de outubro de 2002
O movimento de concentração do segmento de varejo introduz um aspecto
interessante a ser observado que é o desenvolvimento de uma vantagem competitiva
sustentável que conforme Porter (1999) pode ocorrer através de três estratégias básicas: a
busca de um custo mais baixo que a concorrência, o oferecimento de um produto
diferenciado e finalmente uma estratégia de enfoque, onde selecionada uma parcela do
mercado esta é atendida com custos muitos baixos ou diferenciação acentuada dos
produtos. O problema colocado por vários autores é que além da obtenção da vantagem
competitiva sua mensuração é de difícil execução, posto que uma série de variáveis devem
ser observadas.
Neste sentido, de acordo com Buzzell e Gale (1987) não há dúvidas de que a
participação no mercado e o retorno sobre o investimento estão fortemente relacionados.
As empresas que gozam de fortes posições competitivas nos mercados de seus produtos
principais tendem a ser altamente rentáveis. E sugere alguns fatores de posição competitiva
e estratégia como: Participação no mercado, qualidade de produtos e serviços, pesquisa e
desenvolvimento, marketing, valor agregado ao produto e vendas, ativo imobilizado,
produtividade inclusive da mão de obra, avaliação e taxas de utilização dos estoques.
Normalmente estas variáveis são de difícil observação e mensuração, pois existem
problemas de coleta e confiabilidade dos dados disponíveis.
O estudo realizado pretende demonstrar a potencialidade do mecanismo de redes
neurais como ferramenta de previsão de desempenho futuro das empresas de varejo do
segmento de supermercados no Brasil.
2. Redes Neurais Artificiais
As Redes Neurais Artificiais tiveram suas origens em 1911 com o trabalho de
Ramón y Cajál que introduziram a idéia do neurônio como sendo a unidade básica de
processamento do cérebro humano e a rede neural como um conjunto de diversos
neurônios conectados formando a mente humana (HAYKIN, 1994). Mais tarde,
McCulloch e Pitts modelaram matematicamente o funcionamento desses neurônios e seus
relacionamentos em rede, criando as bases da neurocomputação e das Redes Neurais
Artificiais – RNA’s (HERTZ et al., 1991).
Apesar da modelagem teórica, o desenvolvimento das RNA’s não ocorreu de forma
continua devido a problemas operacionais, pois nesta época ainda não haviam sido criados
computadores com tamanho poder de processamento, além da falta de difusão e
compreensão sobre o funcionamento das redes neurais biológicas.
2.1. O Neurônio Artificial
O modelo, baseado na neuroanatomia, simula artificialmente as conexões entre os
neurônios, dispostos em uma rede, onde cada unidade computacional (neurônio) recebe
uma série de entradas e as combina, gerando uma nova entrada a uma série de neurônios
posteriores até a saída final da rede, que deve ser a resposta final ao problema.
Desenvolvido em 1943 por McCulloch e Pitts o perceptron é um modelo matemático do
funcionamento de um neurônio biológico. Assim, o neurônio pode ser definido pelo
seguinte modelo (figura 1):
ENEGEP 2002
ABEPRO
2
XXII Encontro Nacional de Engenharia de Produção
Curitiba – PR, 23 a 25 de outubro de 2002
Sinais
de
entrada
X1
X2
X3
.
.
.
Xn
w1
Função Transferência
w2
w3
.
.
.
Σ T
yj
Saída
wn
Função Soma(sj)
Pesos e
Conexões
Figura 1 – Modelo de um neurônio artificial
Cada neurônio (j) é numerado e indexado, numa analogia ao neurônio biológico
apresenta diversas entradas (dendritos), potencializadas pelos respectivos pesos wj
(conexões sinápticas) e com a função soma simulando a captação do estímulo recebidos,
acumulando de maneira ponderada os sinais recebidos pelo neurônio em sj:
n
s j = ∑ xi w ji
i =1
A partir do valor da soma ponderada, a função de transferência (T) utiliza-se de um
limiar θ para determinar a saída yj :
1 s j ≥ θ
y j = f (s j ) = 
0 s j < θ
Onde a saída yj é determinada pela função f(sj), normalmente uma função sigmóide,
como por exemplo, a função logística (HAYKIN, 1994).
Assim, a saída gerada pelo neurônio será 1 se a soma ponderada for superior ou
igual a θ e 0 se inferior. Onde pode-se comparar θ ao limiar de ativação presente nos
neurônios biológicos.
O potencial de ação de um neurônio biológico acontece ou não, dependendo da
grandeza do estímulo que é aplicado a ele. O limiar é definido como o valor mínimo do
potencial de membrana em que vai ocorrer o potencial de ação. Todos os valores de
potencial de membrana inferiores ao valor necessário para a produção de um potencial de
ação são ditos subliminares. Caso um estímulo não consiga deslocar o potencial de
membrana até o valor limiar, a resposta parcial, subliminar, desaparece. No neurônio
artificial, temos uma situação semelhante, cujo limiar de disparo é operado pela função de
transferência.
2.2. Estrutura da Rede
As RNA’s são formadas por inúmeros neurônios diferentes dispostos de maneiras a
proporcionar um melhor desempenho ao objetivo da rede. A disposição dos neurônios em
diferentes camadas e a variação entre suas conexões de entradas e saídas formam a
arquitetura, ou estrutura da rede.
Entre as diversas estruturas existentes optou-se pelo uso das redes MLP (Multi
Layer Perceptron) propostas pro McCulloch e Pitts e feedforward, redes onde os sinais
fluem das unidades de entrada para as unidades de saída, em direção sempre adiante
(FAUSETT, 1994).
ENEGEP 2002
ABEPRO
3
XXII Encontro Nacional de Engenharia de Produção
Curitiba – PR, 23 a 25 de outubro de 2002
Neurônios
de Saída
Pesos
Entradas
Saídas
Neurônios
Escondidos
Figura 2 – Estrutura de RNA feedforward de duas camadas
As redes feedforward são caracterizadas pela organização dos neurônios em
camadas, na sua forma mais simples a rede projeta os sinais de entrada diretamente para a
camada de neurônios de saída, sendo esta camada simultaneamente de entrada e saída, pois
a entrada não é considerada uma camada por não apresentar nenhuma forma de
processamento.
As redes multicamadas apresentam duas ou mais camadas (Figura 2) e se
diferenciam por apresentarem camadas extras de neurônios. A função destes neurônios é
intervir entre a entrada externa e a saída da rede. Pela adição de uma ou mais camadas
ocultas, a rede se torna apta a extrair relações de alta categoria, proporcionando uma
perspectiva generalizada à rede (HAYKIN, 1994).
2.3. Treinamento da Rede
O aprendizado é um processo pelo qual parâmetros livres de uma rede neural são
adaptados através de um contínuo processo de estimulo pelo ambiente em que a rede se
encontra. O tipo de aprendizado é determinado pela maneira como os parâmetros, ou pesos
das conexões, são atualizados (HAYKIN, 1994).
Um dos mais utilizados algoritmos de aprendizado é o backpropagation (retro
propagação), onde os pesos das conexões entre os neurônios são atualizados no sentido de
minimizar o erro:
ek ( n ) = d k ( n ) − y k ( n )
O erro (ek) é calculado pela subtração do valor esperado (yk) do valor obtido (dk) e a
atualização dos pesos flui de maneira inversa, através da equação (backpropagation):
∆wkj (n) = η ek (n) x j (n)
Em que a variação do peso da conexão w entre os neurônios j e k é o resultado, η é
uma constante positiva que determina a taxa de aprendizagem, e a taxa de erro e x o valor
de entrada do neurônio subseqüente, todos em determinado tempo (n).
2.4. Aplicações das RNA’s
Na área de negócios as aplicações das redes neurais são recentes, na década de 80,
principalmente se comparadas aos primeiros estudos em neuroanotomia, que datam da
década de 50. Dentre as principais aplicações desenvolvidas em redes neurais e suas
publicações nas principais revistas científicas da área, pode-se encontrar a maior utilização
das redes neurais em seis áreas: Finanças, Contabilidade/Auditoria, Recursos Humanos,
Marketing/Distribuição, Sistemas de Informações, Produção/Operações e Outras
(MORAES & NAGANO, 2001).
As redes neurais artificiais apresentam como seu grande atributo a detecção de
padrões não lineares por meio do aprendizado, incluindo dados históricos (YAO et al.,
ENEGEP 2002
ABEPRO
4
XXII Encontro Nacional de Engenharia de Produção
Curitiba – PR, 23 a 25 de outubro de 2002
2000). Assim, suas principais aplicações estão relacionadas à caracterização/análise e
previsões, baseadas em séries temporais de determinados padrões de ocorrências que
auxiliam a rede na resolução do problema objetivo.
As respostas geradas pelas previsões realizadas pelas RNA’s geralmente
apresentam melhores resultados em comparação a métodos de previsão tradicionais, tais
como métodos de regressão linear, as RNA’s podem ser utilizadas como alternativas a
estes métodos para incrementar sua precisão em previsões (SHI et al., 1999).
3. Experimentação
Redes neurais têm sido demonstradas como uma ferramenta promissora para
previsão de séries temporais financeiras, tendo como principais fatores de desempenho a
metodologia de seu desenvolvimento (WALCZAK, 2001).
Para a realização da previsão do faturamento de supermercados utilizou-se como
base de dados as informações contidas no ranking anual dos 300 maiores supermercados
da Associação Brasileira de Supermercados (ABRAS), existentes para os anos de 1991 até
2000. Devido à ocorrência de mudanças de moedas foram utilizados os dados a partir de
1994.
Para a utilização de um modelo de redes neurais para estes sete anos foram
encontradas 31 ocorrências de supermercados que compuseram a lista da ABRAS de 1994
a 2000 simultaneamente.
Dentro das informações disponíveis foram selecionadas:
Faturamento Bruto: valor expresso em reais (R$) para cada ano;
Número de Check-Outs: número de caixas existentes em toda a rede de
determinado supermercado;
Área de Vendas: área total destinada a vendas correspondente a toda a rede;
Número de Lojas: número total de lojas em funcionamento da rede;
Número de Funcionários: o número total de funcionários contratados pela
rede.
Para um modelo de previsão como este são necessárias entradas da rede que são
dados do passado e a saída, que é o valor previsto (ZHANG et al., 2001). Neste caso o
período estabelecido é anual, com seis valores – referentes a 1994, 1995, 1996, 1997, 1998
e 1999 – para a previsão do faturamento no ano de 2000.
Uma das decisões mais críticas, principalmente em casos de previsão, é determinar
a arquitetura apropriada, o número de camadas, os neurônios em cada camada e as
conexões entre estes neurônios. Para tanto foram desenvolvidas 31 redes diferentes, uma
para cada supermercado. Por uma questão metodológica de padronização e comparação
dos resultados o mesmo modelo foi utilizado para todas as ocorrências:
Camada de Saída
Sinais de
Entrada
Saída
Camada Oculta
Camada de Entrada
Figura 3 – RNA desenvolvida para Previsão de Faturamento de Supermercados
ENEGEP 2002
ABEPRO
5
XXII Encontro Nacional de Engenharia de Produção
Curitiba – PR, 23 a 25 de outubro de 2002
A estrutura utilizada no modelo (Figura 3) se baseia no modelo MLP (Multi Layer
Perceptron) e feedforward, conforme apresentada anteriormente, é composta da entrada de
dados, além de duas camadas, com três neurônios na camada oculta e um único neurônio
na camada de saída, que corresponde ao valor de faturamento previsto. O número de
camadas e neurônios possui fundamental importância para o reconhecimento do padrão
dos dados, fica claro que sem uma camada oculta, um simples perceptron com uma saída
linear se torna equivalente a modelos estatísticos lineares preditivos (ZHANG et al., 1998).
Redes com duas camadas (oculta e de saída) são capazes de prover mais vantagens para a
maior parte dos problemas, não se tornando necessárias camadas adicionais.
Para o treinamento, deve-se ressaltar que não existe um algoritmo corrente
disponível para garantir uma solução global ótima ou que resolva um problema de
otimização não linear em tempo razoável, por isso optou-se pelo algoritmo
backpropagation – essencialmente baseado no método do gradiente descendente – que é
um dos mais utilizados.
Os resultados obtidos na previsão do faturamento dos supermercados estão
demonstrados nas seguintes tabelas:
Erro Relativo
FATUR (Obtido) T. FATUR (Esperado) (Absoluto)
Supermercado
A. ANGELONI & CIA LTDA.
ABC ALIMENTOS A BAIXO CUSTO LTDA.
A DAHER & CIA. LTDA.
CABRINI BERETTA & CIA. LTDA.
CARREFOUR COM. IND. LTDA.
CARVALHO & FERNANDES LTDA.
CATRICALA & CIA. LTDA.
CENTRAL COM. IMP. LTDA.
CIA. APOLO DE SUPERMERCADOS
COMPANHIA BRASILEIRA DE DISTRIBUIÇÃO
CIA. ZAFFARI COMÉRCIO E INDÚSTRIA
COMERCIAL CESA S/A
COMERCIAL TATIANA S/A
COFESA COMERCIAL FERREIRA SANTOS S/A
CEREALISTA MARANHÃO LTDA.
CS AVENIDA COM. IMP. LTDA.
CS PRINCIPAL LTDA
DE CARLI S/A SUPERMERCADOS
G. BARBOSA & CIA LTDA.
INDUSTRIAL MOAGEIRA LTDA.
IRMÃOS BOA LTDA.
IRMÃOS RUSSI LTDA.
JAD ZOGHEIB & CIA. LTDA.
J. MARTINS SUPERMERC. PLANALTO LTDA.
KUSMA & CIA. LTDA.
L. C. BONATO E CIA LTDA.
LEMBRASUL SUPERMERCADOS LTDA.
LOJAS POPULARES LTDA.
LUIZ TONIN & CIA. LTDA.
TISCHLER & CIA. LTDA.
SUPERMERCADO RISPOLI LTDA.
409.700.000
51.690.000
37.270.000
32.130.000
8.104.000.000
144.700.000
35.020.000
46.790.000
23.250.000
9.572.000.000
743.300.000
61.010.000
58.200.000
95.620.000
26.390.000
112.100.000
28.000.000
18.540.000
573.900.000
18.230.000
20.570.000
195.800.000
84.440.000
32.530.000
25.020.000
18.420.000
82.520.000
37.740.000
44.550.000
40.650.000
43.980.000
483.400.000
-73.730.000
57.460.000
-5.767.317
41.900.000
-4.630.927
36.100.000
-3.968.023
9.520.000.000 -1.416.000.000
151.700.000
-6.983.878
38.060.000
-3.043.545
45.840.000
948.598
25.370.000
-2.121.395
9.550.000.000
21.870.000
754.600.000
-11.300.000
67.290.000
-6.282.916
69.520.000
-11.320.000
99.550.000
-3.933.340
31.640.000
-5.245.370
99.720.000
12.360.000
27.020.000
984.034
18.360.000
175.271
629.000.000
-55.090.000
18.980.000
-745.709
26.830.000
-6.263.243
241.500.000
-45.690.000
98.870.000
-14.430.000
38.650.000
-6.122.932
30.110.000
-5.094.159
18.430.000
-12.436
74.100.000
8.422.810
44.370.000
-6.632.236
61.320.000
-16.770.000
42.700.000
-2.051.865
35.870.000
8.108.069
Erro Médio
Relativo (%)
% Erro
Relativo
15,25
10,04
11,05
10,99
14,87
4,60
8,00
2,07
8,36
0,23
1,50
9,34
16,28
3,95
16,58
12,39
3,64
0,95
8,76
3,93
23,34
18,92
14,59
15,84
16,92
0,07
11,37
14,95
27,35
4,81
22,60
10,76
Tabela 1 – Resultados das RNA’s para previsão de faturamento
ENEGEP 2002
ABEPRO
6
XXII Encontro Nacional de Engenharia de Produção
Curitiba – PR, 23 a 25 de outubro de 2002
Deve-se ressaltar que o percentual de erro apresentado na tabela não corresponde
ao erro de treinamento da rede, mas ao teste de previsão referente ao ano 2000. Além
disso, o número de épocas de treinamento foi consideravelmente pequeno bem como a taxa
de aprendizado (learning rate), para não comprometer a rede com o viés do overfitting (um
supertreinamento).
Como cada supermercado possui sua própria rede é possível que novas topologias
ou diferentes algoritmos de treinamento possam melhorar o desempenho, minimizando o
erro. Assim, cada supermercado possui a sua própria relação entre as variáveis que podem
determinar o faturamento.
Para medir o desempenho da rede foram determinados os percentuais de erro
relativo:
| FATUR − T .FATUR |
% ERRO =
T .FATUR
A partir desse resultado pode-se observar que algumas redes obtiveram resultados
significativos, como por exemplo, a rede do supermercado COMPANHIA BRASILEIRA
DE DISTRIBUIÇÃO com um erro relativo de 0,23%, e outras não tão significantes, como
foi o caso da rede do supermercado LUIZ TONI & CIA. LTDA. que apresentou o maior
erro relativo, de 27,35%.
Uma segunda análise refere-se à tabela abaixo que mostra a capacidade de
previsibilidade do modelo desenvolvido com a baixa faixa de erro associada.
Faixa de Erro (%)
Número de Supermercados
0-5
10
5-10
4
10-15
8
15-20
6
Acima de 20
3
Tabela 2 – Faixa de erro de previsão do modelo
Apesar da variação dos percentuais de erro das diversas redes neurais
desenvolvidas a média dos erros foi de 10,76%, podendo ser considerada aceitável como
resultado global do experimento.
4. Considerações Finais
Redes neurais artificiais são modelos não-interpretáveis. Seu conhecimento é
codificado em pesos e associado com as conexões da rede. Desvendar as relações de uma
rede neural é praticamente inviável, a extração de regras do modelo tem sido pesquisada e
se demonstram como uma possível forma de transformar o processo de decisão mais
transparente. Apesar disso, os modelos de redes neurais se mostram válidos a utilização em
problemas não estruturados.
Neste trabalho, com a sua utilização em previsão de faturamento de supermercados
o modelo mostra-se apto, com uma média de erro relativo de aproximadamente 10%,
sendo considerada satisfatória.
O estudo desenvolvido demonstrou ser um eficiente modelo de previsão de
faturamento nas redes varejistas. Esta afirmação é ainda mais relevante se considerarmos
que no período analisado ocorreram grandes mudanças no cenário competitivo do varejo
brasileiro e o percentual de erro ainda assim foi reduzido.
Assim, o modelo pode auxiliar tanto as cadeias varejistas como ao mercado na
previsão do faturamento anual de cada rede de supermercados, ajudando no planejamento
estratégico da empresa e na análise de seu desempenho.
ENEGEP 2002
ABEPRO
7
XXII Encontro Nacional de Engenharia de Produção
Curitiba – PR, 23 a 25 de outubro de 2002
Bibliografia
BERMAN, B., EVANS, J. R. Retail Management: a strategic approach. USA: PrenticeHall, 1998.
BUZZEL, R. D., GALE, B. T. Tha PIMS Principles Linking Strategy to Performance.
Macmillan, Inc., 1987.
FAUSETT, L. Fundamentals of Neural Networks: architetures, algorithms, and
applications. USA: Prentice-Hall, 1994.
HAYKIN, S. Neural Networks: a comprehensive foundation. USA: Prentice-Hall, 1994.
HERTZ., J., KROGH, A. and PALMER, R.G. Introduction to the Theory of Neural
Computation. USA: Addison-Wesley Publishing Company, 1991.
LEVY M., WEITZ, B. A. Adminsitração de Varejo. São Paulo: Atlas, 2000.
MORAES, M. B. C. e NAGANO, M. S. Redes Neurais Artificiais em Negócios: conceitos
e aplicações. São Paulo: 1o Seminário USP de Contabilidade, 2001, p. 1-16.
PORTER, M. E. Competição On Competition: Estratégias Competitivas essenciais. Rio de
Janeiro: Campus, 1999.
SHI, S. H., XU, L. D. and BA, L. Improving the accuracy of nonlinear combined
forecasting using neural networks. USA: Expert System with Applications, 1999, Vol. 16
p. 49-54.
WALCZAK, S. An Empirical Analysis of Data Requirements for Financial Forecasting
with Neural Networks. USA: Journal of Managements System, 2001, Vol. 17 p. 203-222.
YAO, J., LI, Y. and TAN, C. L. Option price forecasting using neural networks. USA:
OMEGA – The International Journal of Management Science, 2000, Vol. 28 p. 455-466.
ZHANG, G., PATUWO, B. E. and HU, M. Y. Forecasting with artificial neural networks:
The state of art. USA: International Journal of Forecasting, 1998, Vol. 14 p. 35-62.
ZHANG, G. P., PATUWO, B. E. and HU, M. Y. A simulation study of artificial neural
networks for nonlinear time-series forecasting. USA: Computers & Operations Research,
2001, Vol. 28, p. 381-396.
ENEGEP 2002
ABEPRO
8
Download

Previsão de faturamento no varejo brasileiro utilizando-se