1
UNIVERSIDADE DA AMAZÔNIA
WILIAN CÁSSIO DOS SANTOS
APLICAÇÃO DE REDE NEURAL ARTIFICIAL PARA PREVISÃO DO PRODUTO
DE SAÍDA DE UM EVAPORADOR DE MÚLTIPLOS EFEITOS
BELÉM
2012
2
WILIAN CÁSSIO DOS SANTOS
APLICAÇÃO DE REDE NEURAL ARTIFICIAL PARA PREVISÃO DO PRODUTO
DE SAÍDA DE UM EVAPORADOR DE MÚLTIPLOS EFEITOS
Trabalho de Conclusão de Curso de Graduação
apresentado ao Centro de Ciências Exatas e
Tecnologia da Universidade da Amazônia
como requisito para a obtenção do grau
Bacharel em Engenharia de Produção.
Orientador: Prof. Dr. José Alberto Silva de Sá
BELÉM
2012
3
UNIVERSIDADE DA AMAZÔNIA
Wilian Cássio dos Santos
APLICAÇÃO DE REDE NEURAL ARTIFICIAL PARA PREVISÃO DO PRODUTO
DE SAÍDA DE UM EVAPORADOR DE MÚLTIPLOS EFEITOS
Trabalho de Conclusão de Curso apresentado à Universidade da Amazônia como requisito
avaliativo parcial para obtenção do grau de Engenheiro de Produção.
_________________________________________
Prof. Dr. José Alberto Silva de Sá
UEPA / UNAMA
_________________________________________
Prof. Dr. Hélio Raymundo Ferreira Filho
UEPA / UNAMA
_________________________________________
Prof. MSc. Felipe Fonseca Tavares de Freitas
UNAMA
Apresentado em: 11/12/2012
Conceito: APROVADO
BELÉM
2012
4
A minha esposa Lilian que foi a grande mentora
desta empreitada em minha vida, que sempre
me deu força e apoio nos momentos difíceis,
com palavras e gestos de um amor verdadeiro.
5
AGRADECIMENTOS
Em primeiro lugar agradeço a DEUS pela dádiva da vida e a JESUS por permitir que eu ainda
esteja neste mundo.
À minha esposa e aos meus filhos pelo apoio e compreensão.
Aos mestres desta instituição que não mediram esforços para que o seus conhecimentos me
fossem transmitidos.
Aos meus orientadores que muito contribuíram para a elaboração deste trabalho.
E amigos que de alguma forma contribuíram.
6
A vitória pode ser criada. Até mesmo se as tropas do
inimigo forem muitas, nós podemos achar um modo de
torná-las impossibilitadas de lutar.
Sun Tzu
7
RESUMO
O trabalho teve por objetivo desenvolver um previsor baseado em rede neural artificial
(RNA), capaz de simular a melhor combinação das variáveis de entrada no processo de uma
unidade evaporadora de múltiplos efeitos, para aumentar a eficiência de retirada de água em
uma solução de Aluminato de sódio. Para o desenvolvimento do previsor o modelo de rede
neural artificial utilizado foi feed-forward backpropagation. Os instrumentos de coleta de
dados foram feitos através da observação e análise dos resultados do comportamento de um
evaporador de múltiplos efeitos, mediante alterações das principais variáveis de entrada do
processo em uma unidade instalada no Município de Barcarena-PA, coletadas em um período
de um ano de operação normal, escolhido aleatoriamente. Com o desenvolvimento do
previsor foi possível identificar o impacto na retirada de água do evaporador de múltiplos
efeitos, em decorrência das alterações nos valores das principais variáveis de entrada no
processo, através dos valores da variável de saída estimados pelo previsor. Os testes de
validação da rede neural demonstraram uma forte aderência entre os valores reais e valores
estimados pelo previsor. Na avaliação do treinamento da rede neural os erros calculados pela
diferença entre os valores reais e estimados foram considerados satisfatórios. Como resultado
da pesquisa, verificou-se que é possível obter um aumento na eficiência da retirada de água da
solução de aluminato de sódio do evaporador de múltiplos efeitos, mediante a redução de
perdas de produção por testes de alteração dos parâmetros de entrada na unidade evaporadora
em operação.
Palavras-chave: Rede neural artificial. Previsor. Controle. Evaporador de múltiplos efeitos.
8
ABSTRAT
This research aimed to develop a predictor based on artificial neural network (RNA), able to
simulate the best combination of variables input of an evaporator unit of multiple effects, to
increase efficiency of water removal in a sodium aluminate solution. For the development of
the predictor, the model of the artificial neural network used was feed-forward
backpropagation. The instruments of data collection were done through observation and
analysis of the results of the function of a multiple effect evaporator, through changes in the
main input variables of the process in a unit installed in the city of Barcarena-Pa, collected
over a period of a year of normal operation, chosen randomly. With the development of the
predictor it was possible to identify the impact of the removal of water from the multiple
effects evaporator, as a result of changes in the values of the main input variables in the
process, through the values of the output variable estimated by the predictor. The validation
tests of the neural network showed a strong adhesion between the actual and estimated values
of the predictor. In the evaluation of the neural network training the errors calculated by the
difference between the actual and estimated values were considered satisfactory. As a result
of the research, it was found that it is possible to obtain an increase in the efficiency of water
removal from sodium aluminate solution from the evaporator with multiple effects, by
reduction of production losses by tests changing the input parameters in the evaporation plant
in operation.
Keywords: Artificial neural network. Predictor. Control. Multiple effect evaporator.
9
SUMÁRIO
1
INTRODUÇÃO ........................................................................................................... 11
1.1
TEMA E PROBLEMA .................................................................................................. 11
1.2
OBJETIVOS .................................................................................................................. 16
1.2.1 Objetivo geral ............................................................................................................... 16
1.2.2 Objetivos específicos .................................................................................................... 16
1.3
JUSTIFICATIVA DA PESQUISA ............................................................................... 17
1.4
ESTRUTURA DO TRABALHO .................................................................................. 19
2
CARACTERÍSTICAS DO PROCESSO DE EVAPORADORES DE MÚLTIPLO
EFEITO ........................................................................................................................ 21
2.1
TIPOS DE EVAPORADORE E PRINCIPIOS BÁSICOS DE OPERAÇÃO .............. 23
2.2
APLICAÇÕES DOS EVAPORADORES .................................................................... 25
3
UTILIZAÇÃO DE REDES NEURAIS PARA O CONTROLE DO PROCESSO
DE EVAPORADORES DE MÚLTIPLOS EFEITOS ............................................. 27
3.1
CONCEITO DE REDES NEURAIS ............................................................................. 27
3.2
TIPOS DE REDES NEURAIS ...................................................................................... 30
3.2.1 Redes de camada única ............................................................................................... 31
3.2.2 Redes neurais multicamadas ...................................................................................... 31
3.3
TIPOS DE APRENDIZGEM DE UMA REDE NEURAL ........................................... 33
3.3.1 Aprendizagem não supervisionada ............................................................................ 34
3.3.2 Aprendizagem supervisionada ................................................................................... 35
3.4
O ALGORÍTIMO BACKPROPAGATION .................................................................... 36
4
METOLOGIA DA PESQUISA .................................................................................. 37
4.1
TIPO E DELINEAMENTO DA PESQUISA ............................................................... 37
4.2
COLETA DE DADOS .................................................................................................. 37
4.3
MODELAGEM DA REDE NEURAL ARTIFICIAL................................................... 38
10
4.3.1 Camada de entrada ..................................................................................................... 38
4.3.2 Camada oculta ............................................................................................................. 38
4.3.3 Camada de saída .......................................................................................................... 38
4.3.4 Algoritmo de aprendizagem ....................................................................................... 39
4.3.5 Treinamento da RNA .................................................................................................. 39
4.3.6 Avaliação de performance .......................................................................................... 39
5
ESTUDO DE CASO .................................................................................................... 41
5.1
CARACTERÍSTICA DO PROCESSO PESQUISADO ............................................... 41
5.1.1 Descrição do processo .................................................................................................. 42
5.2
ANÁLISE DO BANCO DE DADOS COLETADO ..................................................... 45
5.3
AVALIAÇÃO DA PRIMEIRA RNA ........................................................................... 47
5.4
AVALIAÇÃO DA SEGUNDA RNA ........................................................................... 48
5.4.1 Avaliação de performance e validação da RNA ....................................................... 49
6
CONCLUSÃO.............................................................................................................. 52
7
RECOMENDAÇÕES PARA ESTUDOS FUTUROS .............................................. 53
REFERÊNCIAS ..................................................................................................................... 54
APÊNDICE A ......................................................................................................................... 56
APÊNDICE B.......................................................................................................................... 57
APÊNDICE C ......................................................................................................................... 61
11
1
1.1
INTRODUÇÃO
TEMA E PROBLEMA
A humanidade vem buscando, ao longo do tempo, formas mais eficientes para
executar as atividades do seu dia a dia, com o objetivo de reduzir esforços, proporcionar
conforto, segurança, saúde, lazer e outras vantagens. Segundo Loesch e Heim (1999, p. 9): “A
otimização faz parte da índole humana”. As organizações produtoras desempenham um papel
fundamental nesta busca, pois é através de seus produtos e serviços que a humanidade vem
desfrutando de melhores condições de vida.
Para que as organizações de bens e serviços possam oferecer ao mercado consumidor,
produtos com qualidade a baixo custo, as mesmas tem que investir constantemente em
tecnologias, para tornar seus processos produtivos mais eficientes. Normalmente estas
tecnologias vêm acompanhadas por sistemas que controlam os parâmetros dos processos ao
longo de suas etapas.
Estes controles são feitos em forma de variáveis, que segundo Montgomery e Runger
(2009), é uma função que confere um número real a cada resultado no espaço amostral de um
experimento.
Bassanezi (2002) diz que quando temos uma variável dependendo quantitativamente
de outra variável independente, pode-se construir um modelo matemático e analisar esta
dependência através das variações destas grandezas. Neste contexto, têm-se os processos com
a utilização de mais de uma variável de controle normalmente correlacionadas entre si,
responsáveis pelas transformações ao longo das etapas dos processos.
Pode ser comum nestes processos, que exigem interação, problemas com múltiplas
variáveis, dificultando a tomada de decisão pela ampla gama de resultados possíveis de se
atingir.
Em processos com sistemas de controle complexos devido a grande quantidade de
variáveis é possível a utilização de redes neurais artificiais (RNA), pelo fato da sua
capacidade de modelar sistemas complexos lineares ou não, e também por possuírem
mecanismos de aprendizagem. Por este motivo as RNA foram idealizadas como uma boa
12
técnica a ser utilizada em controles de processos adaptativos, principalmente em plantas
sujeitas a incertezas nos controles das variáveis e dos processos (CAMPOS; SAITO, 2004).
A inteligência artificial (AI) pode ser aplicada em diversas áreas do conhecimento para
a solução de problemas utilizando sistemas inteligentes como as redes neurais artificiais.
Rezende (2005) exemplifica a utilização de RNA em alguns estudos de casos onde as mesmas
foram aplicadas e demonstraram bons resultados, como na modelagem para controle de um
processo de flotação de minério de ferro da Cia Vale de Rio Doce, onde os resultados obtidos
foram animadores. O modelo aplicado em uma das plantas foi colocado em operação online
com os controladores convencionais para testar sua capacidade de prever o teor de um dos
elementos (sílica) no produto concentrado. Foi feito a comparação entre os valores previstos
pela rede com os valores obtidos através da análise em laboratório. Os resultados da aplicação
do modelo demonstram a possibilidade de dispensar a necessidade de uso do laboratório, pelo
grande grau de aderência do modelo.
Neste âmbito do conhecimento, Campos e Saito (2004) ilustram a aplicação de um
modelo baseado em rede neural artificial no controle de um processo petroquímico, que foi
aplicada ao controle de composição de topo e de fundo de uma coluna de destilação, onde a
rede irá trabalhar em paralelo com o s controladores convencionais do sistema. O objetivo da
rede foi de aprender interativamente e em tempo real um controle complementar, de forma a
otimizar e melhorar o desempenho da planta. Os resultados esperados foram alcançados sendo
demonstrado que a rede neural artificial foi capaz de aprender uma nova maneira de controle
de modo a melhorar o desempenho do sistema.
Lima (2006) realizou um estudo para estimar a concentração de particulado em
suspensão em diferentes bairros da cidade de Ipatinga-MG, através da utilização de
modelagem com rede neural artificial. O modelo foi capaz de fazer previsões de concentração
de alguns poluentes devido ao seu treinamento utilizando as variáveis de entrada como
velocidade dos ventos, chuvas e outros. A variável de saída foi medida pelos resultados
obtidos das estações meteorológicas. A validação do modelo foi realizada pela comparação
entre os resultados reais e os previstos pela RNA, verificando que é possível a utilização deste
tipo de modelo para a previsão de concentração de particulado em suspensão.
A aplicação de redes neurais artificias está presente em diversos segmentos com o
propósito de alguma forma, tornar os processos produtivos mais eficientes, seja através da
melhoria dos controles ou através da previsão de resultados esperados, que possibilitem a
13
tomada de decisões de forma antecipada, proporcionando assim otimização de processos e
ganhos em produtividade através da redução de perdas com testes em planta.
De um modo geral, nos processos produtivos sempre existe a presença de variáveis de
entrada, que são responsáveis por alguma transformação em uma determinada etapa do
processo. De acordo com a complexidade do processo ou produto que se deseja produzir,
estas variáveis sofrem mudanças em quantidades e tipos, podendo ser de natureza Físicoquímica ou Eletro-mecânica.
Ao longo das etapas de produção, é possível a ocorrência de desvios destas variáveis
dentro de um limite pré-estabelecido, de forma a não comprometer a obtenção dos resultados
finais esperados. Porém, é possível que estes desvios ultrapassem os valores toleráveis,
causando assim distúrbios que podem interferir na produção, eficiência ou até mesmo na
qualidade dos produtos fabricados.
Normalmente estas variáveis têm correlações entre si e o grau de importância das
mesmas está relacionado com o impacto de cada uma no processo produtivo. Segundo Larson
e Farber (2010, p. 395): “uma correlação é uma relação entre duas variáveis. Os dados podem
ser representados por pares ordenados (x, y), onde x é a variável independente (ou
explanatória) e y é a variável dependente (ou resposta)”.
Na indústria, de um modo geral, encontra-se dentro dos processos de produção uma
grande quantidade de variáveis necessárias para a fabricação dos mais diversos bens de
consumo.
As variáveis eletromecânicas podem estar relacionadas aos efeitos físicos, que
segundo Pahl et al (2005), podem ser descritos quantitativamente por meio de leis físicas que
coordenam entre si as grandezas envolvidas, como por exemplo, o efeito alavanca através da
lei da alavanca, o efeito de dilatação pela lei de dilatação dos corpos. Os desvios nestas
variáveis podem gerar perdas de produções imediatas, reduzindo assim a produtividade das
instalações.
As variáveis físico-químicas, por sua vez, representam as atividades relacionadas aos
fenômenos responsáveis pelas transformações dentro do processo. O desvio destes pode
causar perdas de produção, mas normalmente seu maior impacto é na eficiência das unidades
produtoras, pois estas variáveis estão muito relacionadas a consumo específico de matéria
prima e/ou energia.
14
Segundo Reis (2001), os fenômenos físicos são aqueles em que a matéria sofre uma
modificação qualquer que não modifica sua composição, como um papel que é rasgado, uma
substância que é aquecida ou a água que muda de estado físico quando evapora. No fenômeno
químico, a composição da matéria é totalmente alterada depois de ocorrer o fenômeno,
gerando uma nova substância, como por exemplo, a queima do papel, que gera cinzas, ou a
formação de uma nova substância com reações químicas.
Em processos produtivos onde a predominância das variáveis é de natureza físicoquímica, observa-se que os resultados desejados nem sempre são atingidos em função de
desvios em apenas uma das variáveis, o que às vezes torna o sistema muito frágil. Este fato se
deve principalmente pela correlação entre as variáveis. O impacto negativo no processo
produtivo será proporcional ao grau de relevância da variável que apresenta o desvio.
Um dos segmentos industriais que tem como principal característica a utilização de
fenômenos físico-químicos para a obtenção de seu produto, é a indústria do alumínio, que
segundo Luz e Lins (2005) é o terceiro elemento em abundância na crosta terrestre, ficando
atrás do oxigênio e silício.
Para a obtenção do alumínio metálico existe uma etapa muito importante, que é a
retirada do óxido de alumínio (Al2O3) da rocha de bauxita. O processo mais utilizado
industrialmente é o Processo Bayer, que consiste em misturar a bauxita moída a uma solução
de soda cáustica, com a qual a mesma reage sob pressão e temperatura. Nestas condições, a
bauxita se dissolve formando uma solução de aluminato de sódio (LUZ; LINS, 2005).
Dentro do complexo processo de extração da alumina destaca-se uma das etapas, que
são as unidades de evaporadores de múltiplos efeitos, que tem como principal finalidade, a
retirada de água da solução de aluminato de sódio.
As unidades de evaporadores operam com a utilização de uma grande quantidade de
variáveis, que combinadas promovem as alterações físicas e químicas na solução de aluminato
de sódio, necessárias à retirada de água desta solução.
Para que a eficiência da unidade de evaporadores possa se manter dento de um limite
tolerável, é necessário que sejam feitas alterações nos parâmetros de processo, de tal forma
que, uma nova combinação das variáveis mantenha a eficiência da unidade.
15
Existem ferramentas que empregam métodos exatos de programação matemática
capazes de nos mostrar de forma quantitativa, a melhor solução para a utilização de variáveis
de entrada em um processo produtivo, buscando a maximização de sua eficiência.
A aplicação de um modelo matemático poderá nos ajudar a encontrar a melhor
combinação entre as variáveis deste processo, permitindo a otimização da produção com
aumento da eficiência desta unidade. Segundo Montgomery e Runger (2009), os modelos
matemáticos podem ser construídos com nossa engenharia e o conhecimento científico do
fenômeno para relacionar as variáveis.
A utilização de modelos matemáticos tradicionais para otimização ou soluções de
problemas pode se tornar inviável pela quantidade de variáveis aplicadas em um único
modelo. De acordo com Braga, Ludemir e Carvalho (2000) nestes casos mais complexos a
utilização de Redes Neurais Artificiais pode ajudar muito, pela facilidade que as mesmas têm
de executar modelagens com um grande número de variáveis não lineares em um espaço de
tempo relativamente curto e com um bom grau de precisão.
O controle de processo que envolve variáveis de engenharia tem um campo muito
vasto de aplicação, como indústrias de manufaturas, plantas químicas, indústrias têxteis,
processos de produção contínua, processos de extração de matéria prima e outros vários
setores da indústria. De acordo com Zsolts (2006), em todos estes segmentos é possível a
utilização de redes neurais artificiais para auxiliar no controle de processo, com várias
literaturas relatando sobre as técnicas de aplicação das redes neurais.
Zsolts (2006) diz que em qualquer sistema de controle de processo as funções
essenciais para o processo são a temporização, a sequência, o sincronismo e o intertravamento
dos eventos. E as funções essenciais para os operadores são o monitoramento, supervisão e a
detecção e tratamento de alarmes. As funções voltadas ao controle de processo podem ser
implementadas com a utilização de controladores convencionais lógicos ou digitais e a
aplicação de redes neurais artificiais neste contexto tem sido de grande importância.
A aplicação de redes neurais artificiais em sistemas com funções voltadas para o
operador na detecção e análise de falhas tem sido explorada com êxito por vários
pesquisadores. O diagnóstico de falhas em sistemas de controle podem ser baseados pela
comparação de padrões e as RNA neste aspecto são excelentes detectores de padrões. Nos
sistemas mais complexos onde exista um grande número de interligação entre as variáveis
16
para a execução de uma função, é necessário que todas as outras funções sejam executadas. A
falha em qualquer um dos componentes da função pode comprometer todo o desempenho da
função principal (ZSOLTS, 2006).
Assim, em relação aos sistemas de controle, um dos problemas para o controle do
processo de uma unidade de evaporadores de múltiplos efeitos é o elevado número de
variáveis de entrada, que são controladas individualmente de tal forma que, o conjunto de
variáveis controladas proporcione o resultado desejado da variável de saída da unidade
evaporadora. Em alguns momentos o controle de uma ou mais variáveis pode não ser atingido
conforme desejado. Neste caso a solução para se manter a produção da unidade é fazer novas
interações entre as variáveis buscando novos parâmetros de controle, o que nem sempre pode
resultar na melhor combinação, causando assim perda de eficiência da unidade evaporadora
de múltiplos efeitos.
Nesse contexto, vislumbra-se a seguinte problemática: É possível melhorar a
eficiência de uma das etapas do processo de obtenção da alumina, que consiste na evaporação
da água de uma solução de aluminato de sódio por meio de evaporadores de múltiplos efeitos,
utilizando-se uma rede neural artificial (RNA) como um previsor do resultado de saída
mediante as alterações nas variáveis de entrada?
1.2
1.2.1
OBJETIVOS
Objetivo Geral
Desenvolver um previsor, baseado em rede neural artificial, capaz de melhorar a
eficiência de retirada de água em uma solução de Aluminato de Sódio, de uma planta de
evaporadores de múltiplos efeitos, no intuito de reduzir perdas no processo.
1.2.2
Objetivos Específicos

Compreender e caracterizar o processo de retirada de água da solução de
aluminato de sódio, através do processo de evaporador de múltiplo efeito;
17

Identificar as variáveis de controle relevantes e suscetíveis à modelagem da rede
neural artificial (RNA);

Treinar e avaliar o desempenho da RNA como um previsor da variável de saída de
um evaporador de múltiplos efeitos.
1.3
JUSTIFICATIVA DA PESQUISA
O alumínio é um metal cada dia mais presente no nosso dia a dia, o quê torna seu
consumo, consequentemente, cada vez maior, principalmente pela descoberta de novas ligas
metálicas, as quais possibilitam a sua aplicação nos mais variados segmentos industriais e
atividades em geral, sejam de natureza econômica ou de teor doméstico.
O alumínio é produzido comercialmente há cerca de 150 anos e, nesse curto período,
sua indústria se expandiu e está presente em 46 países produtores. Nesse panorama, o Brasil é
o sexto produtor mundial de Alumínio primário e tem a terceira maior reserva do minério
(Bauxita) no mundo, localizada na região amazônica. Além da Amazônia, a bauxita pode ser
encontrada no sudeste do Brasil, na região de Poços de Caldas (MG) e Cataguases (MG)
(ASSOCIAÇÃO BRASILEIRA DO ALUMÍNIO, 2012).
No mercado interno, a maior parte do alumínio é aplicada nos segmentos de
embalagens e transportes, seguidos do setor elétrico, construção civil, bens de consumo,
máquinas e equipamentos (ASSOCIAÇÃO BRASILEIRA DO ALUMÍNIO, 2012).
No segmento da alumina, que é o resultado do refino da bauxita, o Brasil ocupa a
quarta posição mundial na produção de alumina, que é o principal insumo das indústrias
produtoras de alumínio primário. No ano de 2010, o Brasil teve uma produção total de
alumina de 9.433.400 toneladas. Deste total produzido, o Pará, que é o maior produtor
nacional, foi responsável por uma produção de 5.718.000 toneladas, representando 60,61% da
produção nacional (ASSOCIAÇÃO BRASILEIRA DO ALUMÍNIO, 2012).
Nas refinarias de alumina, a bauxita passa por várias etapas e transformações, até
atingir o estado de Alumina, que é o estágio mais próximo da transformação da mesma em
alumínio metálico. Nas diversas refinarias espalhadas pelo mundo, o processo é muito
18
semelhante, porém algumas etapas são bem específicas, de acordo com o tipo de Bauxita
processada.
Uma das etapas que é comum em praticamente todas as refinarias de bauxita no
mundo é o processo de retirada de água da solução de aluminato de sódio, feita através de
evaporadores de múltiplos efeitos, que é um processo contínuo composto por algumas
variáveis.
Estas variáveis são os parâmetros de controle, que operam dentro de determinadas
faixas pré-estabelecidas, admitindo-se pequenos desvios de forma que não comprometam a
produtividade e a qualidade do produto da unidade evaporadora.
O controle destas variáveis é feito através de um sistema automatizado, gerenciado por
softwares, capazes de identificar os desvios e corrigi-los. Porém, quando estes desvios
ultrapassam determinados limites, os controladores não são mais capazes de efetuar a
correção, sendo necessária então a intervenção humana.
A pesquisa se justifica pelo fato das intervenções humanas, serem baseadas no
conhecimento e experiência dos operadores, que muitas vezes não são padronizadas em todos
os turnos de trabalho.
Este fato contribui muitas vezes para a tomada de decisão pouco eficaz, o que acarreta
perdas de produção e ou baixa eficiência da unidade de evaporação. Além disto, pretende-se
ainda, que este estudo seja base de informação para uma operação uniforme da unidade
evaporadora, e que as tomadas de decisões pelos operadores, sejam uniformizadas e
embasadas por uma informação com fundamentação técnica.
Uma ferramenta que pode ser de grande ajuda na resolução de problemas que dispõem
de um grande número de variáveis para uma tomada de decisão, pode ser a modelagem
matemática.
Segundo Taha (2008), os modelos hipotéticos são representações verdadeiras de
situações reais. O modelo, expressa de maneira tratável, as funções matemáticas que
representam o mundo real considerado. Nesse contexto, Bassanezi (2002) esclarece que a
matemática pode ser vista como um instrumento intelectual capaz de sintetizar ideias
concebidas em situações empíricas que estão quase sempre camufladas num emaranhado de
variáveis de menor importância.
19
O campo de aplicação da modelagem matemática é muito vasto, como por exemplo:
no estímulo de novas ideias, pode ser usada para fazer previsões, auxilia nas tomadas de
decisões, pode servir como ferramenta para entendimento da realidade e outros mais
(BASSANEZI, 2002).
Na indústria, a modelagem matemática pode ser aplicada eficaz e eficientemente na
resolução de problemas. Ainda segundo Bassanezi (2002), nem todo problema tecnológico é
essencialmente físico em natureza. Os mais importantes e comuns nesta área são originados
por processos de controle e automação.
O Processo de retirada de água da solução de aluminato de sódio, através de um
evaporador de múltiplos efeitos, requer um número elevado de variáveis, controladas de tal
forma, que as alterações físicas e químicas necessárias ao processo sejam realizadas. Estas
variáveis estão correlacionadas entre si, e são controladas por um sistema automatizado, capaz
de corrigir pequenos desvios.
Como a modelagem convencional para processos com muitas variáveis é complexa, a
utilização de uma modelagem por rede neural artificial pode ser uma alternativa atraente para
auxiliar no controle de processo do evaporador.
Com a aplicação de um previsor elaborado a partir de uma modelagem por RNA é
possível realizar a simulação dos resultados esperados na saída do evaporador através de
alterações nas variáveis de entrada, de acordo com as restrições de cada uma dentro do
processo. As redes neurais artificiais são elaboradas com base em aprendizagem e podem ser
facilmente treinadas quando necessário, em função de novas tecnologias ou mudanças
significativas no sistema operacional dos evaporadores.
1.4
ESTRUTURA DO TRABALHO
Este trabalho apresenta-se em sete capítulos. O primeiro trata do tema, problema,
objetivos, justificativa e estrutura do trabalho. O capítulo dois descreve o processo de
evaporadores de múltiplos efeitos, tipos de evaporadores e seus campos de aplicações.
O capítulo três descreve o conceito de rede neural artificial, tipos de redes neurais, métodos de
aprendizagem e de treinamento das redes neurais. O capítulo quatro apresenta a metodologia
do trabalho, como definição do tipo de pesquisa, procedimento de coleta dos dados e
modelagem da rede neural. O capítulo cinco descreve o estudo de caso, como as
características da unidade evaporadora em estudo, tratamento dos dados coletados, validação
20
da rede neural desenvolvida e discussão dos resultados. O capítulo seis apresenta as
conclusões do trabalho. O capítulo sete apresenta algumas recomendações para estudos
futuros.
21
2
CARACTERÍSTICAS DO PROCESSO DE EVAPORADORES DE MÚLTIPLO
EFEITO
Evaporação é um processo de concentração de uma solução aquosa através da retirada
de água por meio do aumento da temperatura até o ponto de ebulição. Segundo Vidal (2004),
Evaporação pode ser definida como a concentração de uma solução pela fervura do solvente.
Dentro de um sistema de evaporação o processo é controlado pelas taxas de
transferência de calor no líquido até atingir o ponto de ebulição, promovendo a retirada do
vapor. O resultado é uma solução com uma concentração maior que a de entrada no sistema.
Segundo Geankoplis (1983), as propriedades físicas e químicas da solução
concentrada e a quantidade de água que se deseja retirar, influenciam diretamente no tipo de
evaporador a ser usado assim como na definição da pressão e temperatura de processo. As
principais características são: concentração, solubilidade, sensibilidade a temperaturas,
pressão e temperatura, formação de crostas e formação de espumas.
A avaliação destas características em cada tipo de solução que será submetida a um
processo de concentração por evaporação é importante, pois o projeto de construção do
evaporador será em função das mesmas. Geankoplis (1983) descreve as características e seus
impactos no processo conforme a seguir:
1- Concentração:
Normalmente a solução de alimentação é diluída proporcionando um elevado
coeficiente de troca térmica e uma baixa viscosidade. Após o processo de retirada
da água esta solução concentrada pode assumir valores elevados de viscosidade,
maior dificuldade de escoamento e menor coeficiente de troca térmica.
2- Solubilidade:
Com o aumento da temperatura da solução a concentração de sais aumenta podendo
ultrapassar os limites de solubilidade do material formando cristais. Este é um fator
que pode limitar os processos de concentração por evaporação. Como os
evaporadores operam com elevação e redução de temperatura é possível a
cristalização dos sais neste momento, causando a deposição dos mesmos ao longo
da unidade.
22
3- Sensibilidade dos materiais à temperatura:
Vários produtos podem se degradar quando submetidos a temperaturas elevadas ou
quando expostos ao aquecimento por tempo prolongado. Produtos alimentícios
como leite, suco de laranja e extratos vegetais e também os produtos farmacêuticos
são exemplos destes materiais.
4- Temperatura e pressão:
O ponto de ebulição da solução está relacionado com a pressão de operação do
evaporador, quanto maior a pressão maior a temperatura requerida para a ebulição.
A medida que a solução é concentrada o ponto de ebulição tende a subir,
requerendo assim pressões abaixo de 1 atm para a solução atingir o novo ponto de
ebulição.
5- Formação de crostas:
Alguns tipos de soluções podem proporcionar a formação de crostas nas superfícies
que estão aquecidas em razão da degradação ou diminuição da solubilidade. A
deposição de crostas nestas superfícies pode causar redução na eficiência de troca
térmica ou até mesmo limitação na alimentação da unidade evaporadora, sendo
necessárias manutenções periódicas para retirada destas crostas.
6- Formação de espumas:
Durante a ebulição algumas soluções podem formar espumas que tendem a
acompanhar o vapor provocando assim perdas de material.
Como pode se observar cada característica é responsável pela definição de uma parte
do projeto de um evaporador devendo ser avaliadas conjuntamente. O correto
dimensionamento de forma que atenda a estes requisitos podem garantir um bom
desempenho do evaporador projetado, atendendo as especificações requeridas ao produto
desejado.
23
2.1
TIPOS DE EVAPORADORE E PRINCIPIOS BÁSICOS DE OPERAÇÃO
Para que ocorra o processo de evaporação é necessário que a solução seja submetida à
presença de calor para que ocorra a vaporização da água presente nesta solução. De acordo
com Vidal (2004), geralmente a fonte de calor é proveniente da condensação de um vapor
d’água saturado realizada em equipamentos denominados trocadores de calor, onde por um
lado passa o vapor e do outro a solução que se deseja aquecer. A transferência de calor é feita
pelo contato das substâncias com as paredes metálicas do trocador de calor que separam os
dois fluidos.
Para cada necessidade existe um tipo específico de evaporador dos mais simples aos
mais complexos sistemas. Geankoplis (1983), diz que a forma mais simples de um evaporador
consiste em uma panela aberta ou uma chaleira. O calor pode ser fornecido por uma chama no
fundo da panela ou um aquecedor imerso no líquido. Este tipo de evaporador é muito simples
de operar e barato de se instalar, porém o consumo de energia é muito alto, uma vez que o
vapor desprendido durante a evaporação é disperso para a atmosfera.
A definição do tipo de evaporador pode estar relacionada com o tipo de transferência
de calor que é utilizado. Existem evaporadores de único efeito como os de tubos horizontais
com circulação natural, tubos verticais com circulação natural, evaporadores de circulação
forçada, evaporadores por agitação com filme de líquido e os evaporadores de múltiplos
efeitos.
Os evaporadores de único efeito são utilizados quando a capacidade de evaporação
exigida é pequena ou o custo do vapor é baixo. De acordo com Geankoplis (1983), este tipo
de evaporador consome muita energia, uma vez que o vapor retirado da solução é jogado fora
não sendo aproveitada a energia contida neste vapor. Por este motivo este tipo de evaporador
é pouco eficiente, para cada 1 Kg de vapor consumido se evapora 1 kg de água.
Para os processos que exigem grande capacidade de evaporação são utilizados os
evaporadores de múltiplos efeitos. Estes evaporadores proporcionam uma redução muito
grande no consumo de vapor, uma vez que 01 kg de vapor pode produzir até 10 kg de água
evaporada. Normalmente as indústrias trabalham com valores entre 3 e 4 kg de água
evaporada por Kg de vapor em função dos custos de instalação das unidades (VIDAL, 2004).
24
O processo de um evaporador de múltiplos efeitos consiste no aproveitamento do
vapor gerado na evaporação da água do primeiro efeito para aquecer a solução do segundo
efeito. A evaporação da água do segundo efeito mesmo com uma temperatura mais baixa
aquece a solução no terceiro efeito, e assim ocorre sucessivamente ao longo de todos os
efeitos da unidade evaporadora. De acordo com Geankoplis (1983), 1 kg de vapor usado no
primeiro efeito evapora 1 kg de água, o mesmo ocorre no segundo e terceiro efeitos,
totalizando 3 kg de água evaporada com a utilização de apenas 1 kg de vapor proveniente de
fonte externa.
De acordo com Vidal (2004), a característica essencial de um evaporador de múltiplos
efeitos é o aproveitamento do vapor produzido em um efeito ser utilizado para aquecer o
efeito seguinte. A evaporação da água ocorre porque a solução que está aquecida até o ponto
de ebulição sofre uma queda brusca de pressão ao entrar nos tanques de expansão que
propositadamente tem uma grande área. A figura 1 mostra o esquema de um evaporador de
efeito triplo.
Figura1- Esquema típico de um evaporador de múltiplos efeitos
Fonte: Vidal (2004)
Onde:
T L= Temperatura da solução
WS = Vazão de vapor
WL = Vazão da solução
WV = Vazão de vapor da evaporação da água
25
C = Concentração da solução
TC = Trocador de calor
TL = Temperatura da solução
CR= Condensado regenerativo (água evaporada da solução)
A economia de um evaporador é medida pela razão entre a quantidade de água
evaporada pela quantidade de vapor consumido. Para que uma unidade evaporadora possa
obter o maior rendimento possível, garantindo sua produtividade é muito importante que
todos os parâmetros de processo sejam controlados de acordo com os valores de projeto.
Como se pode verificar os princípios que regem o funcionamento de um evaporador
estão relacionados principalmente às características da solução e aos desvios nos controles
dos parâmetros de processo, que podem comprometer a qualidade do produto e causar perdas
de produção.
2.2
APLICAÇÕES DOS EVAPORADORES
Os Evaporadores de um modo geral são utilizados nos processos industriais onde
exista a necessidade de concentração dos solutos nas soluções a base de água. Os
evaporadores estão presentes nos mais variados segmentos industriais como plantas químicas,
laticínios, citriculturas, refinarias de alumina e outros.
De acordo com Geankoplis (1983), alguns exemplos típicos do emprego dos sistemas
de evaporação com o propósito de concentração, podem ser verificados em soluções aquosas
de açúcar, cola, suco de laranja, leite, hidróxido de sódio, cloreto de sódio e outras, onde a
solução concentrada é o produto que se deseja e a água é o produto indesejável que é
descartado. Existe ainda a utilização de evaporadores para evaporar água do mar com a
finalidade de obtenção de água potável para consumo humano. A seguir tem-se a descrição
resumida de alguns exemplos citados para aplicações de evaporadores.
1- Indústrias de sucos de frutas: São empregados os evaporadores de único efeito, pelo
fato dos sucos serem sensíveis ao calor e aumentar muito a viscosidade com a
concentração, podendo agarrar nas superfícies do equipamento provocando a queima
26
do mesmo. Nestes casos os evaporadores de único efeito são mais eficientes pelo fato
de terem um baixo tempo de residência e altas taxas de circulação, além de poder
operar com temperaturas mais baixas.
2- Indústrias açucareiras: Os evaporadores utilizados nestas indústrias devem ser
projetados considerando a característica dos açúcares de se caramelizar quando
expostos a altas temperaturas por tempos prolongados. Nestes casos empregam-se
evaporadores de circulação natural.
3- Indústria de papel e celulose: No processo de produção de celulose a madeira é cozida
em solução de carbonato de sódio, fazendo parte do processo a concentração desta
solução através de evaporadores de múltiplos efeitos.
4- Indústria de alumina: Para a fabricação da alumina o minério moído é submetido a um
ataque de carbonato de sódio a temperaturas elevadas, formando uma solução de
aluminato de sódio. Uma das etapas do processo consiste em concentrar esta solução
através de evaporadores de múltiplos efeitos.
O campo de aplicação dos evaporadores é muito amplo e sua utilização pode ser
notada nos mais variados segmentos industriais. Para um bom desempenho das unidades
evaporadoras a fase de identificação do tipo adequado de evaporador que será utilizado é
muito importante, pois uma escolha inadequada pode acarretar em perdas de produção ou
baixa eficiência.
27
3
UTILIZAÇÃO DE REDES NEURAIS PARA O CONTROLE DO PROCESSO DE
EVAPORADORES DE MÚLTIPLOS EFEITOS
As redes neurais podem ser construídas com o propósito de solução de problemas dos
mais variados tipos, com possibilidades de aplicações em diversos segmentos, podendo
resolver problemas nas áreas de modelagem, organização e controle.
A aplicação de uma Rede Neural para controle de processo em um evaporador de
múltiplos efeitos pode ser feita em forma de um previsor dos resultados da saída, mediante
alterações nas variáveis de entrada. Com a utilização de um previsor é possível identificar
qual o melhor resultado da unidade evaporadora antes da alteração dos parâmetros na planta,
evitando assim perdas de produção por resultados não satisfatórios em função de alterações
menos produtivas.
3.1
CONCEITO DE REDES NEURAIS
O primeiro modelo de uma rede neural artificial baseada em um neurônio biológico
teve início em 1943 através do trabalho pioneiro de Warren McCulloch e Walter Pitts, um
psiquiatra e neuroanatomista e o outro um matemático recém graduado. Juntos publicaram um
trabalho com ideias sobre redes lógicas de nodos (neurônios) e os métodos de aprendizagem
para que estes pudessem ser capazes de executar uma função, se prendendo mais na descrição
de um modelo artificial de um neurônio biológico e suas capacidades computacionais.
(BRAGA; LUDEMIR; CARVALHO, 2000).
A partir deste estudo outros pesquisadores demonstraram seus trabalhos nesta área,
como Hebb, que em 1949 mostrou como a aprendizagem de redes neurais artificiais pode ser
conseguida pela variação dos pesos de entrada dos neurônios.
O modelo PERCEPTRON surgiu em 1958, construído por Frank Rosenblatt, que tinha
como topologia de rede neural artificial, uma estrutura de ligação entre os neurônios em forma
de três camadas. A primeira com o propósito de receber os dados. A segunda recebendo os
dados da primeira através das conexões com seus respectivos pesos ajustáveis, enviando os
sinais para a terceira camada de saída em forma de resposta. Pelo ajuste dos pesos o
PERCEPTRON pode ser treinado de acordo de acordo com as informações recebidas do
banco de dados durante a etapa de treinamento.
28
As redes neurais do tipo PERCEPTRON eram limitadas para a solução de alguns
problemas que não demonstravam linearidade que eram difíceis de aprender, representando
uma grande classe de funções com os algoritmos de aprendizagem desenvolvidos até então, o
que culminou em uma freada nos trabalhos de exploração das RNA. Com o desenvolvimento
do algoritmo de retropropagação (backpropagation) em 1982 por John Hopfieldo (BRAGA;
LUDEMIR; CARVALHO, 2000), reacendeu-se o interesse pelos estudos das redes neurais
artificiais pelo fato deste algoritmo proporcionar treinamento para as redes serem capazes de
resolver problemas não lineares.
As Redes Neurais Artificiais – RNA podem ser definidas como ferramentas
computacionais
que
utilizam
modelagem
matemática
baseada
nos
conceitos
do
funcionamento dos neurônios dos seres humanos.
Segundo Haykin (2001), uma Rede Neural pode ser vista como uma máquina
adaptativa com capacidade de aprendizagem, graças à interligação maciça de células
computacionais denominadas neurônios.
Uma Rede Neural pode ser definida ainda como “um processador maciçamente
paralelamente distribuído constituído de unidades de processamento simples, que tem a
propensão natural para armazenar conhecimento experimental e torná-lo disponível para uso.”
(HAYKIN, 2001, p.28).
Esta estrutura funciona baseada na estrutura do cérebro humano que é responsável pela
execução das funções sensoriomotoras e autônomas do corpo, além das emoções, pensamento
e percepção. O cérebro com suas redes de neurônios tem ainda a capacidade de reconhecer
padrões, armazenar conhecimento através de experiências e interpretar observações.
Os neurônios biológicos são divididos em três partes, o corpo da célula, os dendritos e
o axônio, cada um com uma função específica. Os dendritos tem a função de receber as
informações através de impulsos nervosos vindos de outros neurônios e leva-los até o corpo
celular, onde a informação é processada gerando novo impulso. Este impulso é transmitido
através do axônio até os dendritos do neurônio seguinte. Esta ligação entre o axônio de um
neurônio e o dendrito do outro é chamada de conexão sinapse.
Esta união funcional entre os neurônios pela sinapse é que formam as redes neurais no
nosso cérebro. As sinapses funcionam como um controlador de fluxos de impulsos entre os
neurônios da rede de forma variável, sendo esta variação que confere ao neurônio a
29
capacidade de adaptação. A figura 2 representa a configuração da comunicação entre
neurônios biológicos (BRAGA; LUDEMIR; CARVALHO, 2000).
Figura 2 – Representação da comunicação entre neurônios biológicos
Fonte: www.psiqweb.med.br
As unidades de processamento denominadas neurônios artificiais são programadas
para realizar cálculos matemáticos baseados em funções. Segundo Braga, Ludemir e Carvalho
(2000), estas unidades são dispostas em uma ou mais camadas interligadas por um grande
número de conexões normalmente unidirecionais. Um neurônio artificial é uma versão
simplificada de um neurônio biológico, que utilizada modelagem matemática para realização
das funções. Eles possuem n terminais de entrada e um terminal de saída. Para simular o
efeito da sinapse são atribuídos pesos na conexão de entrada que podem ter valores variados.
Para a ativação do neurônio é utilizado uma função de ativação que ativa ou não sua saída,
dependendo dos valores obtidos com o resultado desta função. A figura 3 ilustra a descrição
de um neurônio artificial.
30
Figura 3 – Modelo de um neurônio artificial
Fonte: Baseado em Haykin (2001).
De acordo com Haykin (2001) pode-se caracterizar cada parte de um neurônio
artificial como sendo:
Entrada: Os sinais de entrada representados por X1, X2 e Xn conectados ao neurônio
são multiplicados pelos pesos sinápticos W1, W2 e Wn respectivo a cada sinal de
entrada. Os pesos sinápticos podem assumir valores negativos e são responsáveis pelo
ajuste dos dados de entrada para correção dos erros no valor de saída.
Somatório: Realiza o somatório dos sinais de entrada, ponderados pelas respectivas
sinapses. Ele conta ainda com a entrada de um bias que tem o efeito de aumentar ou
diminuir a entrada da função de ativação.
Função de ativação: A função de ativação tem por finalidade restringir a amplitude
da saída de um neurônio em um intervalo de valor finito, normalmente com valor
unitário [0,1] ou [-1,1] determinando a relação entre a entrada e saída do neurônio.
3.2
TIPOS DE REDES NEURAIS
A estruturação de uma rede neural está relacionada com o tipo de algoritmo de
treinamento que vai ser usado. De acordo com a estrutura de ligações dos neurônios de uma
31
rede neural, têm-se tipos diferentes de arquiteturas. Segundo Haykin (2001), existem três
classes de arquiteturas de redes diferentes. São elas: Redes de camada única, redes de
múltiplas camadas e redes recorrentes.
De acordo com Braga; Ludemir e Carvalho (2000), a definição da estrutura de uma rede
neural é muito importante, pois a estrutura é um fator que restringe o tipo de problema que
pode ser tratado pela rede, que é definido pelo número de camadas da rede, número de
neurônios em cada camada, tipo de conexão entre os neurônios e a topologia da rede.
3.2.1 Redes de camada única
As redes de camada única são formadas por uma camada de entrada de nós e uma
camada de saída de neurônios. A camada de entrada projeta sobre a camada de neurônios em
sentido único. A camada de entrada não é contada para a definição do número de camadas,
porque nesta, não é realizada nenhuma ação computacional.
De acordo com Braga, Ludemir e Carvalho (2000) as redes de camada única só são
capazes de resolver problemas linearmente separáveis. Nas redes de camada única só existe
um nó entre qualquer entrada e qualquer saída da rede.
3.2.2 Redes neurais multicamadas
Uma das redes neurais artificiais mais utilizadas atualmente segundo Campos e Saito
(2004),
é
a
rede
neural
multicamadas
com
o
algoritmo
de
retroprogramação
(backpropagation) para a aprendizagem. Seu desenvolvimento alavancou o uso das redes
neurais artificiais por permitir a sua utilização em estruturas mais complexas, que são capazes
de resolver problemas que não podiam ser tratados por outros tipos de redes neurais. Este tipo
de rede neural artificial tem boa capacidade para áreas como: Controle, reconhecimento de
padrões, estatística e outras.
32
Estas redes neurais são normalmente chamadas de PERCEPTRONS de múltiplas
camadas (MLP), e tem sido aplicada com sucesso para resolver problemas difíceis através de
treinamento de forma supervisionada com o algoritmo backpropagation.
As redes de multicamadas são formadas por mais de uma camada de neurônios entre
alguma entrada e uma saída da rede. Ela “se distingue pela presença de uma ou mais camadas
ocultas, cujos nós computacionais são chamados correspondentemente de neurônios ocultos
ou unidades ocultas” (HAYKIN, 2001, p.47).
A camada oculta tem a função de interagir entre a camada dos nodos de entrada e a
camada de saída da rede. Quanto maior o número de camadas ocultas, maior a capacidade de
processamento da rede. Estas camadas ocultas não fazem parte da entrada ou da saída da rede
neural, por isso são denominadas ocultas.
A figura 4 mostra a estrutura de uma rede multicamada com uma camada oculta, uma
camada de entrada e uma de saída. Pode-se observar que a rede é totalmente conectada, ou
seja, um neurônio em qualquer camada da rede esta conectado a todos os neurônios da
camada anterior.
Figura 4 – Rede neural multicamada com uma camada oculta
Camada de entrada
Camada de saída
Y1
X1
Y2
X2
Y3
Xn
Yn
Camada Oculta
Sinal de entrada
(Variável)
Fonte: Baseado em Haykin (2001).
Sinal de saída
(Resposta)
33
Segundo Haykin (2001), os sinais de entrada se propagam para frente através da rede,
camada por camada. Os nós da fonte da camada de entrada fornecem os padrões de ativação
para os neurônios da segunda camada. Os sinais de saída da segunda camada são utilizados
como entrada para a terceira camada, e assim sucessivamente para o restante da rede. O
conjunto de sinais de saída da camada final de neurônios da rede forma a resposta para os
padrões de entrada na primeira camada de nós de ativação.
3.3
TIPOS DE APRENDIZAGEM DE UMA REDE NEURAL
Uma das características que chama a atenção nas Redes Neurais é a capacidade de
aprendizagem, que é feita através de treinamento, tomando como base os valores das variáveis
de entrada e os resultados das variáveis respostas. “A capacidade de aprender através de
exemplos e de generalizar a informação aprendida é, sem dúvida, o atrativo principal da
solução de problemas através das RNA’s.” (BRAGA; LUDEMIR; CARVALHO, 2000, p. 2).
O aprendizado de uma rede neural através do ambiente que ela está inserida pode ser o
seu principal atributo. Esta habilidade de aprender dentro do seu próprio ambiente pode
melhorar o seu desempenho.
“Aprendizagem é um processo pelo qual os parâmetros de uma rede neural são
adaptados através de um processo de estimulação pelo ambiente no qual a rede está inserida.
O tipo de aprendizagem é determinado pela maneira pela qual a modificação dos parâmetros
ocorre.” (HAYKIN, 2001, p.75).
O processo de aprendizagem de uma RNA inicia-se pela formação do banco de dados,
que de acordo com Campos e Saito (2004), deve ser divido em dois conjuntos, sendo: um
conjunto para o treinamento, que deve corresponder de 80 a 90% dos dados, e um segundo
conjunto para testes e validação da rede com 10 a 20% dos dados. O banco de dados para o
treinamento da rede deve ter tamanho suficiente para conter todas as condições possíveis do
processo operacional para garantir que o treinamento da rede seja abrangente. O mesmo
critério deve ser observado com o conjunto de dados para a avaliação da rede.
A figura 5 representa o fluxograma de processo de aprendizagem utilizado para a
configuração da RNA em estudo.
34
Figura 5 - Fluxograma do processo de aprendizagem da RNA
Definição da Rede
(Número de camadas e
neurônios, Algoritmo de
treinamento)
NÃO
Etapa de treinamento
Banco de
dados para
treinamento
Etapa de validação
Banco de
dados para
validação
Desempenho
satisfatório ?
SIM
Rede disponível para
utilização
Fonte: Baseado em Braga; Ludemir e Carvalho, (2000).
Foram desenvolvidos alguns métodos de treinamento de uma rede neural, que usam
como ferramentas, diversos tipos de algoritmos de aprendizagem. De acordo com a
modelagem matemática do algoritmo a aprendizagem pode ser dividida em dois grupos
distintos, Aprendizagem Supervisionada e Aprendizagem não supervisionada.
3.3.1 Aprendizagem não Supervisionada
A aprendizagem não supervisionada não conta com a existência de um professor para
acompanhar o treinamento da rede. Neste tipo de treinamento a rede só conta com as variáveis
de entrada.
Segundo Braga, Ludemir e Carvalho (2000), a partir do momento que a rede estabelece
harmonia com os dados de entrada de forma estatística, ela consegue desenvolver a habilidade
35
de formar internamente, representações que codificam as características das variáveis de
entrada, criando assim automaticamente novos grupos. Para que seja possível este tipo de
treinamento é necessário que os dados de entrada sejam redundantes de tal forma que a rede
possa sempre comparar os dados entre si.
3.3.2 Aprendizagem Supervisionada
O treinamento de uma rede neural chamado de aprendizagem supervisionada tem esta
definição em função das variáveis de entrada e de saída serem fornecidas por um supervisor,
que tem a função de monitorar a resposta da rede neural artificial para cada valor de entrada.
O treinamento é feito com base nos pares de dados de entrada e saída. Este tipo de entrada
permite à rede um ajuste dos pesos, uma vez que os valores da resposta para cada dado de
entrada é conhecido, permitindo assim, uma aproximação com o valor desejado dentro de um
limite de erro estabelecido (RESENDE, 2005).
Braga, Ludemir e Carvalho (2000), dizem que este é o tipo de treinamento mais
comum, tanto de neurônios com pesos quanto os sem pesos. O objetivo é ajustar os
parâmetros de tal forma que se possa encontrar uma ligação entre os pares de entrada e de
saída. A desvantagem do aprendizado supervisionado é que na ausência do professor a rede
não conseguira aprender novas soluções para situações que não estão nos exemplos de
treinamento. A figura 6 ilustra o processo de aprendizagem supervisionada.
Figura 5 – Representação da aprendizagem supervisionada
Professor
Resposta
desejada
+
Resposta
real
∑
RNA
-
Sinal de entrada
Sinal de erro
Fonte: Baseado em Braga, Ludemir e Carvalho (2000).
36
3.4
O ALGORÍTIMO BACKPROPAGATION
O algoritmo de treinamento para redes neurais backpropagation surgiu em meados da
década de 1980 desenvolvido por Rummelhart, Hinton e Williams. Segundo Rezende (2005),
o mesmo veio solucionar o problema de treinamento das redes de multicamadas, que são
usadas para resolução de problemas com maior complexidade.
“O algoritmo backpropagation é um algoritmo supervisionado que utiliza pares
(entrada, saída desejada), para por meio de um mecanismo de correção de erros, ajustar os
pesos da rede” (BRAGA; LUDEMIR; CARVALHO, 2000, p. 59).
O treinamento da rede é feito através da avaliação dos erros medidos com a comparação
entre os valores de saída desejados e o calculado pela rede. De posse dos resultados dos erros
o algoritmo realimenta a camada oculta para que os pesos atribuídos às variáveis sejam
alterados. Este processo se repete até que os pesos sejam ajustados de tal forma que o erro
seja o menor possível.
De acordo com Braga, Ludemir e carvalho (2000), o treinamento acontece em duas
fases. A forward que é utilizada para definir a saída da rede utilizando o padrão de entrada. E
a fase backward que utiliza a saída informada e a saída fornecida pela rede para atualização
dos pesos. O fluxo desse processamento ocorre em sentidos contrários. Na forward os dados
das variáveis de entrada seguem para a camada de saída. Na backward os erros seguem da
saída para a entrada das conexões dos neurônios.
O que caracteriza o treinamento com o algoritmo backpropagation segundo Rezende
(2005), é o ajuste dos pesos das camadas intermediárias através da retroalimentação, ou seja,
propagação para traz do erro medido na camada de saída.
37
4
4.1
METOLOGIA DA PESQUISA
TIPO E DELINEAMENTO DA PESQUISA
A pesquisa desenvolvida pode ser classificada, de acordo com Silva e Menezes (2005),
do ponto de vista de sua natureza, como pesquisa aplicada, já que tem por finalidade gerar
conhecimentos científicos para aplicação em uma unidade evaporadora de múltiplos efeitos,
que atualmente encontra-se em operação em uma planta de alumina no estado do Pará. Com
relação à abordagem, a pesquisa é de cunho quantitativo.
Ainda segundo Silva e Menezes (2005), sob o ponto de vista dos objetivos, a pesquisa
é descritiva, tendo em vista que o estudo é de um fenômeno, através de correlação entre
variáveis, baseado em coleta padronizada de dados. Pela classificação técnica, a pesquisa é
experimental, pois o estudo da eficiência do evaporador será feito através da análise das
influências das variáveis no processo.
4.2
COLETA DE DADOS
O procedimento de amostragem da pesquisa será feito através de observação
sistemática, pois conforme Silva e Menezes (2005), este tipo de coleta de dados tem
planejamento e realiza-se em condições controladas de forma que os resultados sejam de
acordo com o preestabelecido.
A coleta será realizada com o auxílio de ferramentas computacionais, através de um
software capaz de capturar as informações desejadas, diretamente da rede de controle de
operação do evaporador para uma planilha Excel. Este software permite a definição do
tamanho e quantidades de amostras que serão coletadas.
Os dados serão organizados em tabelas com o uso de recursos computacionais. O
tratamento destes dados será feito através de ferramentas estatísticas e matemáticas, para
análise dos resultados. A apresentação será feita em forma de tabelas e gráficos.
38
4.3
MODELAGEM DA REDE NEURAL ARTIFICIAL
Para o desenvolvimento da Rede Neural Artificial foi utilizado o software MATLAB
(apêndice B), de acordo com as etapas de desenvolvimento específicas para a elaboração da
rede. O modelo de rede utilizado foi feed-forward backpropagation.
4.3.1 Camada de entrada
Na camada de entrada foram utilizados os dados coletados das variáveis de entrada no
processo do evaporador. As variáveis utilizadas foram: Vazão de alimentação de solução de
aluminato de sódio, temperatura de entrada da solução de aluminato de sódio e pressão de
operação da unidade evaporadora, totalizando três variáveis de entrada.
A formação do banco de dados para as variáveis de entrada foi filtrado, eliminado as
amostras com resultados de saída igual a zero, que representavam situações atípicas na
operação do evaporador.
4.3.2 Camada oculta
Na camada oculta para a modelagem da RNA foram utilizados 5 neurônios. A definição
do número de neurônios foi feita de forma aleatória baseada em experiência de modelagem de
outras RNA.
4.3.3 Camada de saída
Para a camada de saída da RNA foi utilizado a medição da variável de saída: vazão de
condensado (água evaporada), referente aos resultados da medição das variáveis de entrada no
evaporador em um mesmo instante.
39
4.3.4 Algoritmo de aprendizagem
O algoritmo utilizado para o treinamento de aprendizagem foi o Backpropagation.
Considerou-se para a camada de entrada 3 variáveis, na camada oculta 5 neurônios e na
camada de saída uma variável.
4.3.5 Treinamento da RNA
Inicialmente realizou-se o treinamento de uma primeira rede com 100% dos dados, com
um total de 8108 amostras. Após o treinamento verificou-se o resultado de saída da rede
neural treinada com os valores padrões de aferição do projeto da unidade evaporadora.
Em seguida, foi realizado o treinamento de uma segunda rede. Para esta nova rede o
banco de dados foi divido, correspondendo a 70% para o treinamento e 30 % para validação
da rede neural artificial. Os dados de validação foram utilizados para fazer as simulações com
o modelo desenvolvido, totalizando 2401 simulações (ver Apêndice C).
4.3.6 Avaliação de performance
A validação da primeira rede neural não foi realizada em função do treinamento da
mesma ter sido realizado com 100% do banco de dados. Foi realizada somente uma avaliação
do treinamento através da utilização dos valores padrões de projeto.
A validação da segunda RNA foi realizada pela comparação dos valores estimados pelo
modelo com os valores reais medidos pelos instrumentos da unidade evaporadora,
correspondente aos 30% dos dados.
Foi avaliado o comportamento dos valores dos resultados das simulações do
treinamento, através de gráfico, verificando-se a tendência dos resultados estimados e a
diferença entre os valores reais e estimados.
40
Para a avaliação da performance foi utilizado o método do erro médio quadrático
(MSE) da diferença entre os valores reais e os valores estimados, conforme Haykin (2001),
este método é eficiente na avaliação de modelos de redes neurais artificiais,
41
5
5.1
ESTUDO DE CASO
CARACTERÍSTICA DO PROCESSO PESQUISADO
A refinaria de alumina instalada no município de Barcarena – PA com capacidade
nominal de 6.320.000 ton/ano, atualmente ocupando a posição de maior refinaria do mundo,
conta com sete unidades de evaporadores de múltiplos efeitos instaladas em seu parque
industrial. A figura 7 mostra uma das unidades instaladas.
Figura 7 – Instalação de um evaporador de múltiplos
Fonte: O autor (2012).
As unidades de evaporadores de múltiplos efeitos são projetas para manter o equilíbrio
do volume de solução de aluminato de sódio nos tanques de processo, através da retirada da
água que entra naturalmente no processo de fabricação da alumina. Os tanques de operação
têm capacidade limitada de armazenamento desta solução, por este motivo o controle de
volume dentro da refinaria é feito de forma muito rigorosa, pois um desequilíbrio entre a
entrada e saída de água poderá ocasionar transbordos destes tanques para as bacias de
contenção.
42
Em várias etapas do processo de refino da alumina tem-se a entrada de água, feita de
forma controlada de acordo com a necessidade de cada etapa da produção. Na principal
matéria prima para a obtenção da alumina a entrada de água é muito significativa em função
da umidade do minério.
Outro aspecto importante que deve ser considerado são as entradas de água pluvial,
principalmente na época do inverno, que em nossa região alcança altos índices
pluviométricos. Pelas características das instalações desta refinaria que tem grandes áreas de
bacias de contenção e tanques de operação não cobertos, a entrada de água de chuva no
processo pode atingir valores expressivos.
Além da importante tarefa de controlar o volume da refinaria as unidades evaporadoras
são responsáveis também pela minimização de custos com a reposição do insumo Soda
Cáustica (NaOH). Uma vez que a água é retirada da solução de aluminato de sódio a
concentração de NaOH aumenta, requerendo assim uma menor quantidade deste insumo para
manter a concentração da solução dentro dos parâmetros de processo necessários para garantir
a produtividade da refinaria.
5.1.1 Descrição do processo
As sete unidades instaladas nesta refinaria foram concebidas por diferentes projetos
elaborados por três fornecedores distintos. Cada unidade tem sua particularidade com relação
a número de estágios (efeitos) e parâmetros de operação, porém obedecem aos mesmos
princípios básicos dos sistemas de evaporadores de múltiplos efeitos.
As unidades de evaporadores operam de forma independente, com sistemas de controle
das variáveis de entrada atuando nas suas respectivas unidades. Cada variável de entrada é
responsável por uma etapa deste processo e o seu controle dentro dos parâmetros
especificados é de fundamental importância para um bom desempenho das unidades.
O controle de todas as variáveis ocorre de forma simultânea, sendo realizado por um
sistema automatizado do tipo Sistema de Controle Digital Distribuído (SDCD), que realiza os
ajustes necessários nas variáveis do processo através de lógicas de programação digital que
43
atuam diretamente nos equipamentos de automação instalados nas unidades de evaporadores,
como válvulas automáticas e bombas hidráulicas.
Os valores medidos das variáveis são realizados através da utilização de sensores
instalados na unidade evaporadora. Cada variável de entrada e saída é medida com um tipo
específico de sensor de acordo com o material e a leitura que se deseja.
A operação de uma unidade evaporadora é complexa pelo elevado número de
parâmetros de controles existentes, que na maioria dos casos estão relacionados entre si. O
descontrole em um destes parâmetros pode interferir no controle de outro, causando assim um
desequilíbrio no sistema e consequentemente perda de produção.
Dentre as diversas variáveis de controle que compõem uma unidade evaporadora de
múltiplos efeitos, destacam-se as variáveis de entrada que tem maior influencia no seu
rendimento e eficiência como vazão de alimentação da solução de aluminato de sódio (Licor
Pobre), temperatura da solução, pressão nos tanques de expansão e a variável de saída vazão
de condensado (água), descritos a seguir:

Vazão de alimentação de solução de aluminato de sódio (Licor Pobre):
Está variável é controlada em vazão volumétrica (m³/h) e tem por finalidade
fornecer a água que será retirada desta solução. A retirada de água (em forma de
condensado) é proporcional à vazão de alimentação do Licor Pobre.

Temperatura da solução de aluminato de sódio (Licor Pobre):
Como a retirada de água se dá pelo fenômeno da ebulição, é necessário que a
solução seja aquecida até atingir este ponto. O aquecimento da solução é feito
através da utilização de vapor vivo saturado em trocadores de calor. A
temperatura é medida em °C.

Pressão nos tanques de expansão:
A pressão é uma variável que tem por finalidade alterar o ponto de ebulição da
solução em cada um dos estágios (efeito) da unidade de acordo com a curva de
entalpia da água, assumindo diferentes valores em cada estágio.
44

Vazão de condensado (Água):
A retirada de água da solução é medida em m³/h, e representa o resultado do
trabalho da unidade evaporadora.
O processo de operação da unidade evaporadora consiste em submeter a solução de
aluminato de sódio a diferentes pressões e temperaturas ao longo dos estágios. Este processo é
realizado através do bombeamento da solução a partir de um tanque de armazenamento que é
alimentado por uma corrente contínua de solução. A solução bombeada com vazão controlada
passa por etapas de aquecimento em trocadores de calor do tipo casco e tubo, tendo como
fonte de energia térmica vapor saturado. A medida que a solução passa pelos trocadores de
calor a mesma vai ganhando temperatura até atingir o ponto de ebulição de 126 °C a uma
pressão de aproximadamente 1,5 bar.
A etapa de ebulição ocorre nos tanques de expansão que proporcionam este fenômeno
pelo fato de possuírem uma grande área volumétrica, causando uma queda brusca na pressão
da solução quando a mesma sai da tubulação e entra no tanque. À medida que a solução passa
pelos tanques de expansão (efeitos) a temperatura da mesma diminui devido a liberação de
calor em forma de vapor saturado. A ebulição da solução com temperatura baixa nos tanques
de expansão subsequentes só é possível graças ao controle da pressão que é reduzida até a
solução atingir novamente o ponto de ebulição de acordo com a tabela de entalpia da água.
A unidade evaporadora opera com pressões negativas (vácuo) em alguns tanques de
expansão para possibilitar a ebulição da solução com baixas temperaturas. A operação com
baixas temperaturas tem por finalidade a minimização de custos operacionais através da
redução do consumo de vapor vivo. O controle da pressão é feito por meio de bombas de
vácuo que proporcionam pressões negativas com valores de até 0,080 mbar.
A quantidade de efeitos em uma unidade de evaporadores é fator determinante para a
definição da temperatura de operação na entrada da mesma. Quanto maior a quantidade de
efeitos menor temperatura de entrada será requerida, minimizando assim o consumo de vapor
vivo.
45
A unidade evaporadora em estudo é composta por doze efeitos. Com uma vazão de
alimentação de solução de 700 m³/h a mesma tem capacidade total de retirada de 100 m³/h de
água. A Figura 8 representa o fluxograma de processo desta unidade.
Figura 8 – Fluxograma de processo do evaporador de múltiplos efeitos
Fonte : Do autor (unidade evaporadora instalada na planta de alumina, Barcarena – PA - 2012).
5.2
ANÁLISE DO BANCO DE DADOS COLETADO
Os dados foram coletados diretamente da rede de controle de operação do evaporador
de múltiplos efeitos e exportados para uma planilha Excel. Extraiu-se uma série de dados das
variáveis de entrada: Temperatura de operação, Vazão de alimentação e Pressão de operação,
simultaneamente com a variável de saída: Vazão de condensado.
O período da amostragem foi de 01/01/2011 a 31/12/2011, com intervalos de média a
cada 01 hora, totalizando 8760 amostras, conforme Tabela 1.
46
Tabela 1 - Coleta de amostras (sem tratamento)
Entradas
Saída
Vazão de Alimentação
Temperatura
Pressão
Vazão de condensado
(m³/h)
(°C)
(mBar)
(m³/h)
1
701
128
0,137
65
2
699
129
0,141
64
3
699
129
0,135
64
...
...
...
...
...
463
701
127
0,087
76
464
702
127
0,087
75
465
700
128
0,089
75
...
...
...
...
...
3677
553
110
0,112
22
3678
143
70
0,209
9
3679
9
72
0,874
0
3680
0
74
0,915
0
...
...
...
...
...
5441
724
130
0,111
87
5442
711
130
0,108
87
...
...
...
...
...
8758
651
130
0,153
68
8759
651
130
0,160
66
8760
652
130
0,153
69
Amostra
Fonte: Do autor (2012).
Na avaliação do banco de amostras observa-se a presença de valores iguais a zero para
algumas variáveis de entrada e saída. Os valores de vazão de condensado igual a zero mesmo
com as variáveis de entrada apresentando valores normais ocorre nos momentos em que a
unidade evaporadora está parando ou entrando em operação.
Para não comprometer o treinamento da rede realizou-se uma filtragem nos dados
descartando-se os registros que apresentavam vazão de condensado igual a zero, resultando
em 8108 amostras (Tabela 2).
47
Tabela 2 – Coleta de dados (com tratamento)
Entradas
Saída
Vazão de Alimentação
Temperatura
Pressão
Vazão de condensado
(m³/h)
(°C)
(mBar)
(m³/h)
1
701
128
0,137
65
2
699
129
0,141
64
3
699
129
0,135
64
...
...
...
...
...
1948
651
126
0,082
71
1949
651
126
0,083
71
1950
649
126
0,082
68
...
...
...
...
...
2097
596
118
0,082
57
2098
602
118
0,082
57
2099
571
118
0,081
55
...
...
...
...
...
3176
701
130
0,108
75
3177
701
130
0,104
75
...
...
...
...
...
6808
678
127
0,132
65
6809
680
126
0,144
66
...
...
...
...
...
8106
651
130
0,153
68
8107
651
130
0,160
66
8108
652
130
0,153
69
Amostra
Fonte: Do autor (2012).
5.3
AVALIAÇÃO DA PRIMEIRA RNA
A tabela 3 indica o resultado da avaliação do treinamento da primeira rede neural
desenvolvida com 100% do banco de dados.
Tabela 3 – Cálculos dos erros para a avaliação do treinamento da primeira rede neural
RNA
Fonte: Do autor (2012).
Erro %
Erro Absoluto (m³/h)
2,586
1,991
48
O erro obtido nesta avaliação consiste na diferença absoluta entre o valor de referência
do projeto da unidade evaporadora e o valor estimado pela rede neural. Nota-se que o erro
pode ser considerado muito baixo, porém para efeito de validação da rede não é representativo
por se tratar de apenas uma amostra. O apêndice A demonstra a simulação realizada.
5.4
AVALIAÇÃO DA SEGUNDA RNA
A figura 9 representa o erro de treinamento da segunda rede obtida com o banco de
dados de 70% das amostras.
Figura 9 – Teste de treinamento (Diferença absoluta entre valores reais e valores estimados)
Teste de treinamento da RNA - Diferença
20,0000
Diferença absoluta
10,0000
0,0000
-10,0000
-20,0000
-30,0000
2401
2301
2201
2101
2001
1901
1801
1701
1601
1501
1401
1301
1201
1101
901
1001
801
701
601
501
401
301
201
1
101
-40,0000
Fonte: Do autor (2012).
A tabela 4 indica o resultado dos erros obtidos para a avaliação do treinamento da rede
neural.
Tabela 4 – Cálculos dos erros para a avaliação do treinamento da rede neural
Erro
Fonte: Do autor (2012).
Absoluto (m³/h)
-5,502
Erro médio quadrático
45,781
49
O erro médio obtido consiste na diferença absoluta entre os valores reais da saída de
água da unidade evaporadora e os valores estimados pela rede neural com o banco de dados
de 30 %. Os dados demonstram uma forte tendência dos resultados estimados pela RNA
apresentarem na maioria das simulações valores abaixo de zero, indicando quase na totalidade
erros negativos.
O erro médio quadrático (MSE) foi calculado de acordo com a equação (1)
demonstrado na tabela 1.
(1)
5.4.1 Avaliação da performance e validação da RNA
Para a etapa de validação da rede foi feito a comparação entre os resultados dos valores
estimados e os valores reais na saída de água da unidade evaporadora, a tendência destes
resultados é representada na Figura 10.
Observa-se que existe uma forte aderência entre os dois valores, pois o comportamento
dos valores estimados retrata o mesmo comportamento dos valores reais. Nota-se que existe o
acompanhamento das tendências de subida e descida dos valores reais pelos valores estimados
pelo modelo da rede neural.
Figura 10 - Gráfico de comparação do valor real x valor previsto
Fonte: Do autor.
50
Para a avaliação estatística do comportamento do modelo de rede neural desenvolvido,
foi feito com auxílio do software MINITAB 16.0, o teste de distribuição dos valores do banco
de dados de 30% utilizado na validação da rede e dos valores estimados pelo modelo, são
demonstrados nas figuras 11 e 12.
Figura 11 – Teste de distribuição normal do valor real (Medido)
Probability Plot of Real (Medido)
Normal
99,99
99
95
Mean
StDev
N
AD
P-Value
66,27
7,487
2432
53,535
<0,005
Mean
StDev
N
AD
P-Value
60,77
5,889
2432
49,954
<0,005
Percent
80
50
20
5
1
0,01
0
10
20
30
40
50
60
Real (Medido)
70
80
90
Fonte: Do autor (2012).
Figura 12 – Teste de distribuição normal do valor estimado (Calculado)
Probability Plot of Estimado (Calculado)
Normal - 95% CI
99,99
99
Percent
95
80
50
20
5
1
0,01
Fonte: Do autor (2012)
0
10
20
30
40
50
60
Estimado (Calculado)
70
80
90
51
O resultado obtido foi uma distribuição não normal para ambos os conjuntos de dados
analisados. De acordo com as figuras 11 e 12 é possível verificar que a distribuição das duas
amostras tem o mesmo comportamento, comprovando estatisticamente a existência de
aderência entre os valores obtidos pela rede neural e os valores reais.
A tabela 5 indica a comparação entre a mediana e o desvio padrão dos valores reais
(medidos) e dos valores estimados (calculados) pelo modelo da rede neural.
Tabela 5 – Comparação da mediana e desvio padrão entre valores reais e estimados
Real (Medido)
Estimado (RNA)
Mediana
67,537
61,037
Desvio padrão
7,487
5,889
Fonte: Do autor (2012).
Como se pode verificar a mediana dos valores estimados pelo modelo apresentou um
valor abaixo do valor real, confirmando a tendência de erros negativos. Com relação ao
desvio padrão a modelagem apresentou um desvio menor que os resultados de saída do
evaporador.
Em termos percentuais a validação foi feita tomando como base a mediana dos valores
reais e valores estimados (ver tabela 6).
Tabela 6 – Resultado do erro calculado pela mediana do valor estimado e valor real
Erro %
Modelo RNA
9,625
Fonte: Do autor (2012).
O erro de 9,625% para o modelo de rede neural desenvolvido, sob o ponto de vista
operacional, pode ser considerado como razoável para um previsor do processo do evaporador
em estudo, pelo fato das variações que ocorrem nas variáveis de entrada e saída do processo.
52
6
CONCLUSÃO
Este estudo demonstrou que é possível a utilização de modelagem por rede neural
artificial como um previsor dos resultados de saída de água (condensado) em uma unidade
evaporadora de múltiplos efeitos. Com os resultados estimados pela rede neural artificial,
verificou-se que é possível obter um aumento na eficiência da unidade evaporadora, através
da redução de perdas de produção por testes de alterações dos parâmetros de entrada na
unidade durante a operação.
Para a elaboração do modelo de rede neural artificial foram utilizadas as variáveis:
vazão de alimentação de solução de aluminato de sódio (m³/h), temperatura de entrada da
solução de aluminato de sódio (ºC) e pressão de operação na unidade evaporadora (bar). A
escolha destas variáveis foi em função de experiência de operação na unidade evaporadora
que demonstra maior sensibilidade a alterações nestes parâmetros.
A topologia de rede neural artificial utilizada foi uma rede de multicamadas, com
aprendizado supervisionado. Na camada oculta foram utilizados 5 neurônios. O algoritmo
utilizado para o treinamento da rede foi o backpropagation.
A avaliação do modelo de rede neural artificial desenvolvido foi feita através da
comparação entre os valores reais de saída do evaporador e dos valores estimados pelo
modelo. Os resultados desta comparação demonstraram uma boa aderência do modelo, que
reproduziu fielmente o comportamento da variável de saída da unidade evaporadora.
Para avaliação do treinamento da rede neural foi utilizado o método do Erro médio
quadrático (MSE) conforme recomenda a literatura, porém como foi desenvolvido somente
um modelo de rede neural a avaliação por este método não foi conclusiva. Foi realizada então
uma avaliação através da média do erro absoluto entre os valores reais e valores estimados. O
erro encontrado foi considerado razoável dentro de um limite de tolerância aceitável sob o
ponto de vista operacional.
Foi verificado que a distribuição dos dados de saída da unidade evaporadora e o
estimado pelo pela rede neural, apresentaram uma distribuição não normal. Por este motivo
para a validação do modelo de rede neural foi calculado o erro percentual considerando a
diferença entre as medianas dos dois valores. O resultado obtido também é considerado
razoável podendo, portanto ser validada a rede neural artificial.
53
7
RECOMENDAÇÕES PARA ESTUDOS FUTUROS
O banco de dados utilizado teve uma abrangência de um ano de operação da unidade
evaporadora, porém após a modelagem da rede neural verificou-se que em alguns momentos a
amostragem representava momentos atípicos da operação do evaporador, como momentos de
partida ou parada da unidade. A filtragem realizada no banco de dados levou em consideração
somente os valores que indicavam zero em algumas das variáveis. Portanto, recomenda-se
para estudo futuro fazer uma triagem no banco de dados de forma que sejam reportados
somente os valores das variáveis de entrada e saída em condições normais de trabalho (CNT).
O modelo de rede neural aplicado ao previsor foi feito com apenas uma configuração,
como o erro não foi menor que 5% é recomendado que sejam feitas novas configurações de
rede neural, para se fazer uma comparação entre as mesmas através do erro médio quadrático
(MSE), que poderá indicar qual modelo tem o melhor desempenho.
54
REFERÊNCIAS
ASSOCIAÇÃO BRASILEIRA DO ALUMÍNIO. Disponível em: <http://www.abal.org.br>.
Acesso em: 22 mar. 2012.
BASSANEZI, Rodney Carlos. Ensino – aprendizagem com modelagem matemática: uma
nova estratégia. São Paulo: Contexto, 2002.
BRAGA, Antônio de Pádua; LUDEMIR, Teresa Bernarda; CARVALHO, André C. P. de
Leon. Redes Neurais Artificiais: Teoria e Aplicações. LTC – Livros Técnicos e Científicos /
Editora S.A. – Rio de Janeiro, 2000.
CAMPOS, Mário Massa de; SAITO, Kaku. Sistemas inteligentes em controle e automação
de processos. Rio de Janeiro: Editora Ciência Moderna Ltda, 2004.
GEANKOPLIS, Christie J. Transport processes and unit operations. Newton –
Masschusetts: Allynand Bacon – 1983.
HAYKIN, Simon. Redes Neurais: Princípios e Práticas; trad. Paulo Martins Engel. 2. ed.
Porto Alegre: Bookman, 2001.
LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 4. ed. São Paulo: Pearson Prentice
Hall, 2010.
LIMA, Mônica Marques Caetano de. Estimativa de concentração de Material particulado
em suspensão na atmosfera por meio da modelagem de rede neural artificial. 2006.
Dissertação apresentada ao Programa de Pós-graduação em Saneamento, Meio Ambiente e
Recursos Hídricos - Escola de engenharia, Universidade Federal de Minas Gerais, Belo
Horizonte, 2006.
LOESCH, Claudio; HEIM, Nelson. Pesquisa Operacional: Fundamentos e Modelos.
Blumenau: FURB, 1999.
LUZ, Adão Benvindo da; LINS, Fernando Antônio Freitas. Rochas & Minerais Industriais:
usos e especificações. 2. ed. Rio de Janeiro: CETEM/MCT, 2005.
55
MONTGOMERY, Douglas C.; RUNGER, George C. Estatística Aplicada e Probabilidade
para Engenheiros. Tradução e revisão técnica, Verônica Calado. 4. ed. Rio de Janeiro: LTC,
2009.
PAHL, Gerhard ; BEITZ, Wolfgang; FELDHUSEN Jorg ; GROTE, Karl-heinrich. Projeto
na engenharia: Fundamentos do desenvolvimento eficaz de produtos métodos e aplicações.
São Paulo: Editora Edgard Blucker, 2005.
REIS, Martha Marques da Fonseca. Completamente química: Química Geral. São Paulo:
FTD, 2001.
REZENDE, Solange Oliveira. Sistemas inteligentes: fundamentos e aplicações /
organização. Barueri – SP: Manole, 2005.
SILVA, Edna Lúcia da; MENEZES, Estera Muszkat. Metodologia da Pesquisa e
Elaboração de Dissertação. 4. ed. rev. atual. Florianópolis: UFSC, 2005.
TAHA, Hamdy A. Pesquisa Operacional: uma visão geral. São Paulo: Pearson Prentice
Hall, 2008.
VIDAL, Luís Roberto de Godói. Manual de operações Unitárias. Tradução: Hemus, 2004.
ZSOLTS, L. Kovács. Redes neurais artificiais: fundamentos e aplicações– 4. ed. Ver. – São
Paulo: Editora Livraria da Física, 2006.
56
APÊNDICE A
Programação de simulação para avaliação do treinamento da primeira rede neural
>> p = [700;126;0.080] % teste padrão
p=
700.0000
126.0000
0.0800
>> y = sim(net,p) % simulação com o valor padrão
y = 76.9912
57
APÊNDICE B
>> load data_input.txt
>>data_input = data_input';
>> load data_output.txt;
>>data_output = data_output';
>>savedata_input
>> save data_output
>>net = newff(data_input,data_output,5)
net =
Neural Network object:
architecture:
numInputs: 1
numLayers: 2
biasConnect: [1; 1]
inputConnect: [1; 0]
layerConnect: [0 0; 1 0]
outputConnect: [0 1]
numOutputs: 1 (read-only)
numInputDelays: 0 (read-only)
numLayerDelays: 0 (read-only)
subobject structures:
inputs: {1x1 cell} of inputs
layers: {2x1 cell} of layers
outputs: {1x2 cell} containing 1 output
biases: {2x1 cell} containing 2 biases
inputWeights: {2x1 cell} containing 1 input weight
layerWeights: {2x2 cell} containing 1 layer weight
functions:
adaptFcn: 'trains'
divideFcn: 'dividerand'
58
gradientFcn: 'gdefaults'
initFcn: 'initlay'
performFcn: 'mse'
plotFcns: {'plotperform','plottrainstate','plotregression'}
trainFcn: 'trainlm'
parameters:
adaptParam: .passes
divideParam: .trainRatio, .valRatio, .testRatio
gradientParam: (none)
initParam: (none)
performParam: (none)
trainParam: .show, .showWindow, .showCommandLine, .epochs,
.time, .goal, .max_fail, .mem_reduc,
.min_grad, .mu, .mu_dec, .mu_inc,
.mu_max
weight and bias values:
IW: {2x1 cell} containing 1 input weight matrix
LW: {2x2 cell} containing 1 layer weight matrix
b: {2x1 cell} containing 2 bias vectors
other:
name: ''
userdata: (user information)
>>net = train(net,data_input,data_output)
net =
Neural Network object:
architecture:
numInputs: 1
numLayers: 2
59
biasConnect: [1; 1]
inputConnect: [1; 0]
layerConnect: [0 0; 1 0]
outputConnect: [0 1]
numOutputs: 1 (read-only)
numInputDelays: 0 (read-only)
numLayerDelays: 0 (read-only)
subobject structures:
inputs: {1x1 cell} of inputs
layers: {2x1 cell} of layers
outputs: {1x2 cell} containing 1 output
biases: {2x1 cell} containing 2 biases
inputWeights: {2x1 cell} containing 1 input weight
layerWeights: {2x2 cell} containing 1 layer weight
functions:
adaptFcn: 'trains'
divideFcn: 'dividerand'
gradientFcn: 'gdefaults'
initFcn: 'initlay'
performFcn: 'mse'
plotFcns: {'plotperform','plottrainstate','plotregression'}
trainFcn: 'trainlm'
parameters:
adaptParam: .passes
divideParam: .trainRatio, .valRatio, .testRatio
gradientParam: (none)
initParam: (none)
performParam: (none)
trainParam: .show, .showWindow, .showCommandLine, .epochs,
.time, .goal, .max_fail, .mem_reduc,
.min_grad, .mu, .mu_dec, .mu_inc,
.mu_max
weight and bias values:
60
IW: {2x1 cell} containing 1 input weight matrix
LW: {2x2 cell} containing 1 layer weight matrix
b: {2x1 cell} containing 2 bias vectors
other:
name: ''
userdata: (user information)
61
APÊNDICE C
Programação de simulação para avaliação do treinamento da segunda rede neural (exemplo)
>> p = [700;126;0.080]; % teste padrão
>> y = sim(net,p) % simulação com os valores padrões
y = 78.6473
>> p = [600;126;0.11]; % entrada da simulação 5677
>> y = sim(net,p) % simulação
y = 59.6421
>> p = [600;126;0.1070]; % entrada da simulação 5678
>> y = sim(net,p) % simulação
y = 60.2222
(...)
>> p = [651;130;0.1600]; % entrada da simulação 8107
>> y = sim(net,p) % simulação
y =57.7424
>> p = [652;130;0.1530]; % entrada da simulação 8108
>> y = sim(net,p) % simulação
y =58.9264
Download

aplicação de rede neural artificial para previsão do produto