FreeNMS – Uma Plataforma Software Livre para Gerência e
Administração de Nível de Serviço (SLM)
Flavia Carvalho, Aguinaldo Fagundes Junior, Jorge Guedes Silveira
Fernando Lunardelli, Marcelo Azambuja.
Laboratório METROPOA - Programa de Pós-Graduação em Engenharia Elétrica
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
Avenida Ipiranga, 6681 - Porto Alegre - RS - Brasil
[fpereira, aguinaldo, guedes, lunardelli, azambuja]@freenms.org
Resumo. Neste artigo são descritas as principais características do Sistema
Gerente de Rede (NMS) FreeNMS. Este sistema, desenvolvido em um projeto
acadêmico de pesquisa do laboratório ReMAV MetroPoa da PUCRS que
ganhou o apoio de empresas, foi totalmente desenvolvido com Softwares
Livres. Além de atender as exigências de um NMS, também possui
funcionalidades de Gerência de Nível de Serviço (SLM). Inovações como a
possibilidade de realizar gerência distribuída e contar com soluções voltadas
para a implantação de “ambientes de gerência” nas empresas (NOC), como é
o caso do Sistema de Registro de Falhas (TTS) integrado ao sistema gerente,
tem chamado a atenção nos meios acadêmico e corporativo para este projeto.
Abstract. In this paper, some of principal FreeNMS Network Management
System (NMS) features are described. This system, developed in an
academical research project from Metropoa ReMAV Lab, from Pontifícia
Universidade Católica do Rio Grande do Sul (PUCRS), got enterprises
backing and was completely built with Free Softwares. Beyond achieve NMS
needs, it has Service Level Management. This project got academic and
corporative environment attention, thankfulness innovations like the
possibility of distributed management and to figure on directed implemmented
solutions for companys "management environment" (NOC), like Trouble ticket
System (TTS) integrated to management system.
1. Introdução
O projeto FreeNMS – Free Network Management System [FreeNMS 2002],
desenvolvido por um grupo de pesquisadores (de graduação e pós-graduação) do
Laboratório ReMAV (Redes Metropolitanas de Alta Velocidade) Metropoa da PUCRS1,
tem como objetivo maior o desenvolvimento de uma Plataforma Software Livre de
Gerência de Nível de Serviço que visa auxiliar as empresas diante dos novos desafios de
Qualidade de Serviço (QoS) exigidos pelos clientes, através de contratos SLA (Service
Level Management).
1
O prof. Dr. Jorge Guedes é coordenador geral do laboratório Metropoa da PUCRS, e os demais autores
deste artigo são alunos do Programa de Pós-Graduação da Faculdade de Engenharia Elétrica da PUCRS e
fazem parte do grupo que desenvolve o projeto FreeNMS. O prof. MSc. Marcelo Azambuja é ex-aluno
deste programa de pós-graduação e coordena o projeto FreeNMS.
Esse projeto vem sendo desenvolvido há mais de três anos de forma ininterrupta
e baseado em um grande número de pesquisas. Estas pesquisas vão desde análise e
testes de ferramentas comerciais de gerenciamento, a fim de levantamento das
principais características oferecidas por estas, até entrevistas e estudos de caso em
grandes operadoras de rede de Porto Alegre e São Paulo, a fim de concluir o conjunto
de requisitos e funcionalidades necessárias ao FreeNMS.
As alternativas comerciais para gerência de grandes redes, tais como HP
OpenView, CA Unicenter, IBM NetView e NetHealth Concord, estão na casa das
centenas de milhares de dólares (chegando tranqüilamente aos milhões, de acordo com
o tamanho da rede a ser gerenciada). Percebemos então que o interesse em alguma
solução Software Livre para a área de gerência de redes seria muito bem vinda, pois
nem mesmo as grandes empresas estão conseguindo arcar com o valor abusivo das
Plataformas comerciais, que atualmente podem cobrar estes valores devido a pouca
concorrência na área. O FreeNMS está se baseando totalmente nas Plataformas
comerciais mais utilizadas e a intenção é concorrer diretamente com estes sistemas e,
desta forma, realmente ser uma opção séria para as empresas que necessitam de
Plataformas de Gerenciamento. Como exemplo, a empresa PROCERGS - Companhia
de Processamento de Dados do Estado do Rio Grande do Sul, recentemente fechou
importantíssimo acordo de cooperação e pesquisa com a PUCRS, tendo em vista a
utilização do FreeNMS nesta empresa e em outros órgãos do governo.
O sistema já se encontra em fase de testes e tem alcançado resultados
plenamente satisfatórios em duas grandes operadoras locais2, e estará sendo
disponibilizado para download nos próximos meses.
Neste artigo temos uma visão geral sobre o sistema e as principais
funcionalidades são explanadas, com as devidas justificativas e conclusões que levaram
a cada definição do projeto. Maiores detalhes técnicos sobre cada módulo do sistema
serão explorados em trabalhos futuros, devido o espaço necessário para este tipo de
relato.
2. Gerenciamento de Nível de Serviço (SLM) no FreeNMS
O FreeNMS trata-se de um Software Livre para Gerência de Redes, usando SNMP
(Simple Network Management Protocol) e outras tecnologias para a gerência
automatizada e integrada de grandes redes. Como diferencial, possui além das
características tradicionais de uma Plataforma de Gerência de Redes, funcionalidades de
acompanhamento de Qualidade de Serviços (QoS) contratados (contratos estes
denominados SLA – Service Level Agreement).
No módulo de controle de SLAs do FreeNMS, configura-se uma qualidade de
serviço desejada (para um determinado enlace da rede)3 e o sistema passa a monitorar a
qualidade deste serviço ininterruptamente, gerando alarmes quando SLAs não são
respeitados. Desta forma, o FreeNMS realiza Gerência de Nível de Serviço (SLM Service Level Management). Um exemplo típico de SLA é o oferecido pela empresa
Embratel aos clientes de alguns dos serviços oferecidos por esta empresa [Embratel
2
Os resultados destes testes, bem como os locais onde foram realizados, serão divulgados posteriormente
em artigos específicos.
3
Exemplo de Contrato SLA: um provedor de serviços de rede compromete-se que a Latência (RTT) entre
a Ponta A e Ponta B de um determinado Enlace nunca ultrapasse, (por exemplo) 100ms.
2002]. O FreeNMS é um sistema que, entre outras funcionalidades tradicionais de
Plataformas de Gerência de Redes, pode ser utilizado em situações como esta, onde
tanto a empresa prestadora está interessada em saber se está conseguindo cumprir o
acordo a que se comprometeu, quanto o cliente que está querendo saber se está
recebendo o serviço com a qualidade contratada.
3. Disponibilização das Informações: Interfaces Web e Visando NOC
Um dos problemas administrativos levantados durantes as pesquisas nas operadoras de
rede foi em relação à forma como estas empresas disponibilizariam as informações dos
SLAs contratados (a qualidade dos serviços), tanto para os clientes como para os
próprios funcionários da operadora, a fim de acompanhamento e controle.
Durante o projeto do sistema, ficou decidido que o FreeNMS deveria
proporcionar tanto o controle interno em uma Prestadora de Serviços de Rede (por parte
dos responsáveis técnicos da Prestadora), quanto externo (por parte dos clientes desta
Prestadora): ou seja, um mesmo sistema, com a mesma base de dados reais coletados
continuamente pelo Sistema Coletor do FreeNMS (Poller4). Para o usuário externo,
cliente da operadora, foi desenvolvido um acesso via Web ao sistema, onde então
diversos relatórios a respeito dos serviços contratados estarão disponíveis. Estes
relatórios são gerados dinamicamente, no momento da solicitação, com dados sempre
atuais da base de dados do sistema. Para os usuários internos da operadora o acesso é
também totalmente baseado na Web, e há desde acessos do tipo “administrativo”, que
possui direitos de configuração do sistema, até acessos “gerenciais”, onde os
administradores da operadora poderão obter relatórios de “alto nível”, com informações
sumarizadas sobre diversos aspectos da rede.
Desta forma, tanto os clientes quanto os funcionários da operadora podem
acessar a qualquer momento o status dos diversos contratos SLA em andamento. Para os
técnicos da operadora ainda estarão disponíveis, via Web, todas as demais informações
pertinentes a um Sistema Gerente de Rede: gráficos de utilização da rede, mapa e
descoberta da rede, cadastros e configurações, alarmes diversos etc.
Ainda para os técnicos e operadores, há um tipo de informação essencial, que
são os Alarmes de SLA Corrompidos (ou próximos de serem corrompidos). Estes
alarmes é o que possibilitam uma Gerência pró-ativa, pois de acordo com a
configuração de SLA cadastrada no sistema, o alarme será emitido mesmo antes do
problema realmente ter acontecido5, bem como uma maior rapidez na solução de
problemas quando já deflagrados.
Em relação à visualização dos alarmes, um subsistema especial foi
desenvolvido. No FreeNMS, este sistema é denominado Display de Alarmes e
concentra todas as mensagens geradas pelos diversos processos do sistema. Sua
interface visa a projeção em grandes telas, característica necessária para ambientes de
NOC (Network Operation Center). Desta forma, os técnicos operadores do NOC podem
facilmente visualizar novos alarmes que forem gerados pelo sistema.
4
Estes “sistemas coletores” costumam ser denominados “poller”, em muitas Plataformas de
Gerenciamento e é assim denominado também no FreeNMS.
5 Por exemplo: quando a latência chegar a 80ms um alarme será emitido, enquanto o contrato de SLA na
verdade permite que a latência seja de até 100ms. Para isto, basta configurar o sistema para o valor 80ms
como valor máximo (threshold) para o parâmetro Latência.
4. Um Sistema de Registro de Falhas (TTS) integrado ao FreeNMS
“É importante que o TTS esteja disponível ao usuário final porque diminui a
burocracia na solução de qualquer problema”.
Profa. Liane Tarouco – UFRGS.
Entre os aspectos administrativos e operacionais mais importantes que foram
observados durante as pesquisas realizadas nas operadoras, foi quanto à necessidade de
um Sistema de Registro de Problemas (TTS - Trouble Ticket System).
Estes sistemas devem permitir a abertura, registro e acompanhamento de
“chamados”. Além disso, devem conter em sua base de dados a relação detalhada de
equipamentos da empresa, bem como os endereços de cada equipamento. Também deve
conter a relação dos técnicos que prestam suporte, com a devida identificação de que
tipo de equipamento ou problema cada técnico é habilitado a trabalhar. Este
relacionamento inclusive (qual técnico pode atender este chamado) é indicado que o
próprio sistema já indique no momento em que um problema for cadastrado no sistema.
Mas o fato operacional / administrativo que mais chamou a atenção foi que, não
raro, um mesmo operador de NOC tinha em sua frente dois monitores de computador:
um deles rodando o sistema de gerência, onde os alarmes são mostrados, e
imediatamente ao lado deste, um segundo monitor rodando um TTS, onde tão logo um
alarme fosse mostrado no sistema de gerência, este então deveria ser cadastrado no
TTS, muitas vezes de forma totalmente manual.
Esta situação chamou a atenção do grupo durante o projeto do sistema, pois
entre nossas preocupações estava a de oferecer uma solução total para o “ambiente de
gerenciamento” de uma rede. Sistemas de Registro de Problemas são uma categoria a
parte em se tratando de Sistemas de Informação, a ponto de existirem software-houses
dedicadas somente a este tipo de software. Mas não podíamos imaginar estes sistemas
funcionando de forma isolada (ou fracamente conectados), como foi detectado. Além da
redundância de dados e de trabalho, a probabilidade de erros devido a intervenção
humana necessária na situação descrita é enorme. Finalmente, tínhamos como objetivo
criar um sistema em que a velocidade da detecção de problemas fosse a maior possível.
E para a operadora e o cliente, de nada adiantaria esta detecção ser extremamente rápida
se o “processo” envolvido no decorrer desta descoberta, para a solução do problema,
não for igualmente rápido. Desta forma um módulo TTS foi desenvolvido e integrado
totalmente com a base de dados do FreeNMS. O resultado prático é que quando um
alarme é gerado pelo sistema de gerência, este é inserido no TTS imediatamente, que
por sua vez possui inúmeras rotinas e regras, “assumindo” e encaminhando a solução.
O TTS foi desenvolvido durante um certo tempo como se fosse um projeto (na
verdade um sistema) à parte. A complexidade e quantidade de características próprias
deste tipo de sistema eram tão grandes, que fomos obrigados a adotar esta estratégia.
Não desejávamos que os demais módulos e tarefas do sistema restringissem quaisquer
que fosse a necessidade levantada pelo grupo que ficou responsável por este Módulo
TTS (este subsistema foi denominado TTS FreeNMS). Assim sendo, o grupo pôde
desenvolver livremente o sistema como se este fosse ser executado individualmente em
alguma operadora. Todas as características esperadas e necessárias foram levantadas e
desenvolvidas. Após todo este trabalho concluído é que a integração entre os (até então
dois) sistemas foi realizada. Obviamente, o grupo do TTS seguiu algumas diretrizes e
normas básicas de desenvolvimento, base de dados etc, já existentes no projeto, o que
facilitou e possibilitou esta integração total. Hoje, o TTS FreeNMS possui as
características mais relevantes a este tipo de sistema: usuário recebe automaticamente e
on-line (via Web e por e-mail) o status dos chamados; o sistema encaminha problemas
para o corpo técnico responsável de forma automática; mantém histórico de todas as
ações tomadas, desde a abertura de um chamado até o seu fechamento; diferentes
prioridades para diferentes problemas; Base de Conhecimento: sugere soluções para
problemas encontrados, baseados na análise de ocorrências passadas (paradigma RBC Raciocínio Baseado em Casos); emissão de relatórios.
5. Arquitetura Geral do FreeNMS
Um aspecto importante da metodologia de concepção é a opção de utilizar somente
sistemas e fontes Software Livre. Neste trabalho foram utilizados, por exemplo, alguns
dos principais softwares condizentes com esta diretriz, tais como o Sistema Operacional
GNU Linux, servidor Web Apache, Bancos de Dados MySQL e PostgreSQL, as
linguagens C++, Perl e PHP.
Basicamente, o módulo central (Poller) do FreeNMS realiza coletas periódicas
de diversas informações dos equipamentos gerenciados e armazena-os na base de dados
da aplicação. Através da análise destes dados é que relatórios são gerados e alarmes de
quebra de SLAs são disparados. Conta também com módulos de descoberta de rede
(módulo Network Discover) e Help-Desk (módulo TTS - Trouble Ticket System).
Permite também que usuários sejam criados (os clientes da prestadora de serviços de
redes) e a estes atribuídas interfaces e/ou equipamentos de rede. Isto permite que cada
usuário tenha acesso a informações dos equipamentos e serviços por ele utilizados. Ao
mesmo tempo, permite que o software gerencie elementos de rede de diversos usuários
simultaneamente, sem perda de sigilo entre os usuários. Na Figura 1 temos a arquitetura
típica de um Sistema Gerente de Redes (NMS) e, particularmente, do FreeNMS.
Como pode ser observado, o modelo tradicional de um NMS consiste de uma
aplicação Gerente requisitando informações dos Agentes (equipamentos gerenciados).
Em muitos casos os Agentes também tomam a iniciativa de se comunicar com o
Gerente, enviando alarmes (denominados traps) sobre um evento anormal (queda de
link, tentativas de acesso forçadas com senhas erradas etc).
As requisições das informações de gerência são em espaços de tempo prédeterminados (por ex: a cada 5 minutos). Assim sendo, a cada 5 minutos temos uma
atualização no Banco de Dados da aplicação Gerente sobre o status atual de cada um
dos equipamentos gerenciados pelo NMS. Desta forma, é possível realizar um
levantamento sobre todo o histórico, sobre o funcionamento atual, diário, semanal,
mensal e anual, através da geração de relatórios e gráficos estatísticos.
Figura 1. Arquitetura de Funcionamento de um NMS típico e do FreeNMS em particular
5.1 Gerência Distribuída no FreeNMS
O FreeNMS foi projetado e desenvolvido para trabalhar em pequenos, médios e grandes
ambientes de rede. E o modelo de gerência Internet (baseado no protocolo SNMP)
possui um problema prático para a implantação em ambientes médios e grandes.
Na Figura 1, podemos perceber que a estação Gerente concentra em seu
segmento de rede todo o tráfego de requisições e recebimento de dados com
informações da rede. Desta forma, em ambientes com muitos equipamentos, o acúmulo
de tráfego neste segmento seria tão grande que traria sérios problemas para a própria
rede gerenciada. A solução desenvolvida para este problema no FreeNMS foi a
concepção de pollers distribuídos (representadas pelas Estações Gerentes em cada
“Prédio” na Figura 1). Esta particularidade é muito importante ser frisada, pois
certamente é uma das características técnicas mais fortes do FreeNMS e cujo
desenvolvimento foi dos mais desafiadores, pois praticamente todas as demais
funcionalidades do sistema tiveram que contar com características que possibilitassem
essa arquitetura.
O poller pode ser considerado o “coração” de um Sistema Gerente, pois é dele
que partem todas as requisições, de tempos em tempos. No FreeNMS, foi desenvolvida
uma arquitetura de Banco de Dados distribuído, permitindo que pollers também estejam
geograficamente distribuídos. Estas bases de dados distribuídas são as que recebem
todos os dados dos equipamentos da rede do domínio de gerência respectivo. Estas
bases distribuídas por sua vez são replicadas e atualizam o banco de dados “central”,
que então é o que acumula as informações totais da rede. Nesta base central é que são
obtidos dados de todos os equipamentos da rede para a geração dos relatórios e que
concentra o cadastro e o acesso de usuários ao sistema como um todo.
5.2 Demais Características e Funcionalidades
Apesar de não ter sido relacionado como uma típica funcionalidade de um NMS nas
pesquisas realizadas, também foi desenvolvido um sistema de network discover
(“descoberta de rede”) e o respectivo network viewer (mapa da rede). Este discover visa
dar apoio aos primeiros passos das ações de gerenciamento, pois trata por si só de
encontrar todos os nodos e elementos de rede, com suas hierarquias e ligações (físicas e
lógicas) dentro da topologia da rede em questão, além de possibilitar uma visualização
gráfica da rede. Nas pesquisas e entrevistas durante a fase de análise para o NMS, um
sistema de discover foi sempre citado com uma “funcionalidade muito útil e
necessária”, pelos usuários e funcionários de empresas que utilizam outros NMS.
As demais funcionalidades do FreeNMS são listadas abaixo:
•
•
•
•
•
•
•
•
•
•
•
•
Geração de Relatórios e Gráficos diversos sobre o status da rede.
Detecção imediata de falha de rede em equipamentos (nodes down).
Realizar Descoberta de Rede (Network Discover) e detecção automática e
constante de novos (ou retirada de) nodos da rede.
Mapa gráfico da rede gerenciada, com status de nodos up e nodos down.
Interface totalmente baseada na Web (Web-based).
Sistema Coletor (poller) multi-thread de coleta de variáveis SNMP e status:
o Permite a existência de pollers distribuídos (gerência distribuída).
Independência do SGBD (Sistema Gerenciador de Banco de Dados).
o Atualmente suporte aos bancos PostgreSQL e MySQL.
TTS incorporado, permitindo acompanhamento e abertura de chamados de
forma integrada ao sistema: visando ambientes de NOC e Help-desk.
Sistema Display de Alarmes para acompanhamento das Mensagens do Sistema:
facilidade para implantação de ambientes NOC (Network Operation Center).
Sistema totalmente desenvolvido com (e para) Softwares Livres.
Instalação rápida e prática através de pacote RPM.
Permite a criação de Usuários e Domínios de Gerência: usuário acessa
informações somente dos equipamentos por ele utilizados, possibilitando
diversos usuários e confidencialidade dos dados entre estes.
6. Conclusão
O projeto FreeNMS, que originou o sistema gerente de rede de mesmo nome, tem
possibilitado o domínio das várias tecnologias envolvidas direta e indiretamente com o
desenvolvimento do sistema em questão e o andamento de muitas pesquisas para os
alunos de graduação e pós-graduação da Faculdade de Engenharia Elétrica da PUCRS.
Este trabalho também tem buscado atingir um dos objetivos do projeto ReMAV
MetroPoa, que é o estudo e desenvolvimento de tecnologias para gerência de redes. Mas
os resultados e repercussão iniciais de certa forma surpreendentes, alavancados
principalmente pelo contínuo e crescente interesse por parte de empresas, que buscam
poder contar com uma opção mais econômica e com maior capacidade adaptativa,
fizeram com que o projeto ganhasse dimensões muito sérias e profissionais. E este tipo
de trabalho, onde há uma integração real entre o meio acadêmico através da pesquisa, e
do meio corporativo através da prática e também de apoio aos pesquisadores (através de
bolsas-auxílio), coincide com os objetivos atuais para a área de pesquisa, que visa gerar
o desenvolvimento através desta união entre Pesquisa e Desenvolvimento (P&D).
O projeto tem servido também para mostrar (e resolver) as dificuldades de
administrar interesses muitas vezes tão diversos, que são o meio acadêmico,
normalmente mais interessado com os resultados teóricos das pesquisas, e o meio
empresarial, sempre buscando resultados práticos (e financeiros) imediatos. Felizmente,
o grupo tem aprendido a lidar com estas duas realidades e vem conseguindo atender os
dois objetivos em paralelo. Embora saliente que foi a experiência com erros anteriores
que permitiu com que hoje a cobrança seja compatível com a realidade, onde os
participantes do grupo são na maioria estudantes, que além do projeto possuem toda a
sua responsabilidade e afazeres acadêmicos.
Finalmente, o grupo tem lutado por objetivos que deveriam ser sempre metas
para a grande maioria das pesquisas: o domínio de uma tecnologia, a disseminação dos
conhecimentos para o público interessado e possibilitar, realmente, que os resultados
alcançados produzam benefícios para a comunidade e o meio onde estão inseridos,
gerando desenvolvimento através da geração de empregos e da retenção (e atração) de
divisas para o país.
Referências Bibliográficas
Embratel. (2002) “Internet com certificado de garantia.” Disponível em:
<http://www.embratel.net.br/internet/info/gd-termos.html>. Acesso em: Set. 2002.
FreeNMS. Free Network Management System. (2002) “FreeNMS – Documentação do
Projeto”. Disponível em: <http://www.freenms.org> . Acesso em Dez. 2002.
IETF. Internet Engineering Task Force. (1991) “Management Information Base for
Network Management of TCP/IP-based internets: MIB-II”. Disponível em:
<http://www.ietf.org/rfc/rfc1213.txt?number=1213>. Acesso em Jul. 2002.
NMF. Telemanagement Fórum. (1999) “SLA Management Handbook”. Disponível em:
<http://www.tmforum.org> em: TM Forum Documents. Acesso em Ago. 2001.
Download

FreeNMS – Uma Plataforma Software Livre para Gerência e