UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS TECNOLÓGICAS DEPARTAMENTO DE ENGENHARIA DE TELECOMUNICAÇÕES Curso de Engenharia de Telecomunicações IMPLANTAÇÃO DE UM SISTEMA DE MONITORAMENTO DE SERVIDORES E SERVIÇOS DE REDE COM O SYSTEM CENTER OPERATIONS MANAGER EUCLIDES ALEXANDER DE CASTRO JÚNIOR BLUMENAU 2008 EUCLIDES ALEXANDER DE CASTRO JÚNIOR IMPLANTAÇÃO DE UM SISTEMA DE MONITORAMENTO DE SERVIDORES E SERVIÇOS DE REDE COM O SYSTEM CENTER OPERATIONS MANAGER Trabalho de Conclusão de Curso (TCC) apresentado à banca examinadora do curso de Engenharia de Telecomunicações do Centro de Ciências Tecnológicas da Universidade Regional de Blumenau, como requisito parcial para a obtenção do grau de Engenheiro de Telecomunicações. Orientador: Francisco Adell Péricas BLUMENAU 2008 RESUMO Este trabalho apresenta um estudado da ferramenta de monitoramento Operations Manager, visando facilitar o gerenciamento de uma Infra Estrutura de TI, que nos tempos atuais, pode ser muito difícil de gerenciar, apresentando custos altos e fixos. Teve como principal objetivo implantar o System Center Operations Manager, um sistema de monitoramento de servidores e de serviços de rede, em uma empresa de consultoria de Tecnologia da Informação. O trabalho foi realizado seguindo as seguintes etapas: estudo do Operations Manager, análise da infra-estrutura de rede, definição do cenário de implantação e instalação do Operations Manager. Foi realiza ainda uma análise do funcionamento do sistema. Os resultados apontaram que o Operations Manager é uma ferramenta extremamente eficiente para executar tarefa de monitoramento. Ele possibilita reduzir o tempo de indisponibilidade de serviços, prevenir paradas nos serviços e servidores de rede e detectar erros nos aplicativos. Palavras Chaves: Monitoramento de servidores; Operations Manager; Gerenciamento de redes. ABSTRACT This work presents one studied of the monitoring tool Operations Manager, aiming facilitate the management of an Infrastructure of IT, that in the current times, can be very difficult to manage, which high and fixed costs. It had as main goal implant System Center Operations Manager, a servers monitoring system and of net services, in a Technology consultancy company of the Information. The work was accomplished following the next stages: Study of the Operations Manager, net infrastructure analysis, implantation and installation scenery definition of Operations Manager. Was still accomplishes a system operation analysis. The results pointed that Operations Manager is an efficient tool at execute monitoring task. He enables increase time of services availability, prevent stopped in the net servers and services and to detect errors in the applications. Keywords: Servers monitoring; Operations Manager; Service management. SUMÁRIO 1 Introdução ............................................................................................................ 10 1.1 2 Objetivos ....................................................................................................... 11 1.1.1 Geral ....................................................................................................... 11 1.1.2 Específico ............................................................................................... 11 Fundamentação Teórica ......................................................................................... 12 2.1 Gerenciamento de Serviços de TI ..................................................................... 12 2.2 Information Technology Infrastructure Library (ITIL) ........................................ 13 2.2.1 2.3 Áreas do Gerenciamento de Serviços de TI ................................................. 13 Microsoft Operations Framework - MOF ......................................................... 16 2.3.1 Fase Planejar ........................................................................................... 18 2.3.2 Fase Entregar ........................................................................................... 19 2.3.3 Fase Operar ............................................................................................. 19 2.3.4 Camada Gerenciar .................................................................................... 20 2.4 System Center ................................................................................................ 21 2.5 Operations Manager ....................................................................................... 23 2.6 Componentes ................................................................................................. 24 2.7 Requisitos ...................................................................................................... 28 2.7.1 Base de dados OperationsManager ............................................................. 28 2.7.2 Root Management Server (RMS) e Management Server (MS) ...................... 29 2.7.3 Operations Console .................................................................................. 29 2.7.4 Agente .................................................................................................... 30 2.7.5 Reporting Server ...................................................................................... 30 2.7.6 Reporting Data Warehouse ........................................................................ 31 2.7.7 Audit Collection Services (ACS) ............................................................... 31 2.8 3 Metodologia ......................................................................................................... 36 3.1 4 Fases do Trabalho ........................................................................................... 36 Análise e Discussão dos Resultados ........................................................................ 38 4.1 A Infra Estrutura ............................................................................................. 38 4.1.1 Especificações do Ambiente da Empresa Prestadora de Serviços ................... 38 4.1.2 Especificações dos Ambientes dos Clientes ................................................. 41 4.2 Serviços Monitorados ...................................................................................... 51 4.3 Cenário de Implantação ................................................................................... 52 4.4 Procedimentos de Instalação ............................................................................ 57 4.5 Funcionamento ............................................................................................... 61 4.5.1 Monitoramento ........................................................................................ 62 4.5.2 Criação ................................................................................................... 66 4.5.3 Relatórios ................................................................................................ 67 4.5.4 Administração.......................................................................................... 68 4.6 5 Topologia ...................................................................................................... 32 Análise do Monitoramento............................................................................... 70 Conclusões ........................................................................................................... 74 5.1 Sugestões para continuação do Trabalho ........................................................... 75 6 Cronograma .......................................................................................................... 76 7 Referências ........................................................................................................... 77 LISTA DE TABELAS Tabela 1 - Requisitos da base OperationsManager ........................................................... 28 Tabela 2 - Requisitos do RMS e MS .............................................................................. 29 Tabela 3 - Requisitos para a Operations Console ............................................................. 29 Tabela 4 - Requisitos para o Agente ............................................................................... 30 Tabela 5 - Requisitos do Reporting Server ...................................................................... 30 Tabela 6 - Requisitos para o Reporting Data Warehouse .................................................. 31 Tabela 7 - Requisitos para o ACS .................................................................................. 31 Tabela 8 - Servidores físicos. ........................................................................................ 39 Tabela 9 - Servidores Virtuais. ...................................................................................... 39 Tabela 10 – Servidores a serem monitorados pela empresa prestadora de serviço. ............... 41 Tabela 11 - Relação de Função e Código ........................................................................ 54 Tabela 12 - Servidores Virtuais. .................................................................................... 57 Tabela 13 - Alertas mais comuns ................................................................................... 72 Tabela 14 - Uso da memória disponível .......................................................................... 73 Tabela 15 - Cronograma de Atividades. .......................................................................... 76 LISTA DE FIGURAS Figura 1 – O Ciclo de Vida de TI. .................................................................................. 17 Figura 2 - Fase planejar. ............................................................................................... 18 Figura 3 - Fase entregar. ............................................................................................... 19 Figura 4 - Fase Operar. ................................................................................................. 20 Figura 5 – Camada Gerenciar. ....................................................................................... 21 Figura 6 - Componentes que formam um Management Group. ......................................... 25 Figura 7 - Componentes Instalados num mesmo Servidor................................................. 32 Figura 8 - Componentes Distribuídos ............................................................................. 32 Figura 9 - Portas e Protocolos utilizados ......................................................................... 34 Figura 10 - Domínios sem relação de confiança .............................................................. 35 Figura 11 - Representação dos Componentes .................................................................. 53 Figura 12 - Distribuição dos Componentes ..................................................................... 54 Figura 13 - Cenário de Implantação. .............................................................................. 55 Figura 14 - Verificador de Pré-requisitos no SRV-BNU301 .............................................. 58 Figura 15 - Verificador de Pré-requisitos no VSRV-BNU203 ........................................... 59 Figura 16 - Autoridade Certificadora (CA)...................................................................... 61 Figura 17 - Console Operacional na aba de Administração ............................................... 62 Figura 18 - Console Operacional na aba de Monitoração .................................................. 63 Figura 19 - Visão de Alertas Ativos. .............................................................................. 64 Figura 20 - Visão Computadores ................................................................................... 65 Figura 21 – Healt Explorer. ........................................................................................... 65 Figura 22 - Gráfico com os dados coletados .................................................................... 66 Figura 23 - Console Operacional na aba de Criação ......................................................... 67 Figura 24 - Console Operacional na aba de Relatórios ..................................................... 68 Figura 25 - Configurações na Aba de Administração ....................................................... 69 Figura 26 - Webconsole. ............................................................................................... 70 Figura 27 - Alertas mais comuns ................................................................................... 72 Figura 28 - Uso da memória disponível. ......................................................................... 73 LISTA DE ABREVIATURA TI – Tecnologia da Informação MOF – Microsoft Operations Framework ITIL – Information Tecnology Infrastructure Library SNMP – Simple Network Management Protocol RMS – Root Management Server MS – Management Server ACS – Audit Collection Services DNS – Domain Name Services WINS – Windows Internet Name Service DHCP – Dynamic Host Configuration Protocol IIS – Internet Information Services VPN – Virtual Private Network WSUS – Windows Server Update Services WTS – Windows Terminal Server ISA – Internet Security and Accelerations Server FTP – File Transfer Protocol SMTP – Simple Mail Transfer Protocol NNTP – Network New Transfer Protocol IP – Internet Protocol TCP – Transmission Control Protocol 10 1 INTRODUÇÃO O monitoramento e o gerenciamento de servidores é uma parte crítica de qualquer infra-estrutura moderna de Tecnologia da Informação (TI). É de vital importância garantir que a sua infra-estrutura de TI não apenas funcione corretamente, mas também seja adequada para suportar a carga exercida pelos usuários. No entanto, coletar essas informações não é fácil, e saber o que fazer com elas após obtê-las é uma questão à parte. Segundo Kurose (2005), uma rede consiste em muitas peças complexas de hardware e software que interagem umas com as outras. Quando estes componentes são montados em conjunto por alguma organização para formar uma rede, ocasionalmente podem apresentar defeitos, seja por elementos da rede mal configurados, recursos da rede utilizados excessivamente ou componentes de rede defeituosos. O administrador de rede, cuja tarefa é mantê-la ―viva e atuante‖, deve estar habilitado a reagir a esses contratempos. Com potencialmente milhares de componentes de rede espalhados por uma grande área, ele, em sua central de operações, evidentemente necessita de ferramentas que o auxiliem a monitorar, administrar e controlar a rede. Atualmente as organizações estão muito dependentes da TI para suportar e aprimorar os processos corporativos requeridos para suprir as necessidades organizacionais e dos clientes. Em muitos casos, os serviços de TI formam a base para todo um modelo corporativo; nesses exemplos, a TI não apenas suporta os negócios — ela é o negócio, conforme apresentado por Microsoft Operations Framework – MOF (2008). O Microsoft(R) Operations Manager torna isso possível há sete anos e sua versão mais recente, o System Center Operations Manager 2007, expande ainda mais essa base. Este software de gerenciamento varre automaticamente os logs de eventos e os contadores de desempenho dos servidores, filtrando e analisando esta informação, orientando-se na base de conhecimento. Quando detecta um problema, executa automaticamente scripts corretivos ou gera alarmes para notificar os administradores de redes. A ferramenta também produz relatórios que retratam a ―saúde‖ da rede e dos servidores. 11 1.1 OBJETIVOS Os objetivos desta Pesquisa estão subdivididos entre objetivo geral e específicos, conforme segue: 1.1.1 Geral Implantar um sistema de monitoramento de servidores e de serviços de rede, utilizando o System Center Operations Manager 2007, utilizando como estudo de caso uma empresa de consultoria de Tecnologia da Informação. 1.1.2 Específico Analisar a infra-estrutura da rede da empresa; Identificar o cenário de implantação que melhor se aplica à empresa; Instalar e configurar o System Center Operations Manager e os softwares necessários; Avaliar o sistema de monitoramento implantado; 12 2 FUNDAMENTAÇÃO TEÓRICA Na fundamentação teórica, inicialmente, será apresentada uma visão geral do Information Technology Infrastructure Library (ITIL) e do Microsoft Operations Framework (MOF). Essas são as bases do Operations Manager. Em seguida será apresentada a linha de produtos System Center da Microsoft e uma descrição aprofundada do Operations Manager. 2.1 GERENCIAMENTO DE SERVIÇOS DE TI Segundo Prince, Mueller e Fenstermacher (2007), um pensamento comum entre os Gerentes de TI é: "Por que devo me importar com o negócio? Eu apenas gerencio o departamento de TI." Este pensamento pode até estar correto de certa maneira, pois como gerente de TI, não são responsáveis por certas atividades chaves do negócio. Contudo, quando essas atividades estão sendo processadas em seus servidores, se tornam uma peça crítica desse quebra cabeça. Por exemplo, um servidor de banco de dados que armazena informações essenciais para o dia a dia do departamento de cobranças da organização. De repente começase a entender como tudo está ligado. Um elo dessa corrente quebrado ou faltando pode gerar mais estrago e prejuízo que poderia ter sido imaginado. O gerenciamento de serviços de TI está integrado com os negócios como um todo. Pode-se definir o gerenciamento de serviços de TI como um meio de organizar e prover constantes aperfeiçoamentos na qualidade desses serviços. Gerenciamento de serviços de TI deve ser orientado a entregar e prestar suporte aos serviços de TI que afetam diretamente os requisitos do negócio da organização (Academia de Gerenciamento Microsoft, 2007) Esta é apenas uma das varias razões pela qual a Microsoft criou a Microsoft Operations Framework (MOF), baseado no Information Technology Infrastructure Library (ITIL). A idéia por traz do MOF e ITIL é criar uma estrutura de uma equipe completa com os objetivos da excelência em serviços. O Operations Manager é mais que apenas uma ferramenta que centraliza eventos e processos da rede. O Operations Manager foi criado com os conceitos do MOF (Prince; Mueller; Fenstermacher, 2007). 13 2.2 INFORMATION TECHNOLOGY INFRASTRUCTURE LIBRARY (ITIL) De acordo com a Academia de Gerenciamento Microsoft (2007), as organizações de TI foram, inicialmente, orientadas a temas técnicos, porém, com o passar do tempo, o objetivo passou a ser orientado à qualidade dos serviços. Isto significa que as organizações de TI, para cumprir estes objetivos, precisam concentrar-se na qualidade dos serviços de TI e estarem alinhadas com os objetivos do negócio ou organização. Por esse motivo, cada vez mais empresas estão reconhecendo as organizações de TI como um importante mecanismo de entrega dos serviços aos seus clientes. Primeiramente, é importante entender que tanto o ITIL quanto o MOF, não são baseados em tecnologia. Ambos são baseados em processos. O ITIL é uma biblioteca de livros que descreve uma abordagem ao gerenciamento de serviços de TI, originalmente criado no Reino Unido pela Secretaria do Comércio (Office Of Government Commerce, OGC), para criar um padrão do gerenciamento de operações. Essa biblioteca pertence ao Governo do Reino Unido e conta com 60 livros que descrevem as melhores práticas dos processos de TI criados por líderes do mercado da época. O ITIL é constantemente atualizado por um grupo conhecido como "IT Service Management Forum (ITSMF)‖ (Prince; Mueller; Fenstermacher, 2007). Segundo Academia de Gerenciamento Microsoft (2007), a ITIL é um conjunto de documentos públicos, que baseados em processos e um padrão de melhores práticas da indústria, permitem o Gerenciamento de Serviços de uma organização de TI com qualidade, por um preço justo. A ITIL está relacionada com todos os processos que precisam ser executados dentro das empresas para o gerenciamento e operação da infra-estrutura de TI, para obter um excelente fornecimento de serviços aos clientes sob um esquema de custos congruentes com as estratégias do negócio. 2.2.1 Áreas do Gerenciamento de Serviços de TI Segundo a Academia de Gerenciamento Microsoft (2007), as áreas de gerenciamento de Serviços de TI são classificadas da seguinte maneira: 14 2.2.1.1 Gerenciamento de Configuração As organizações de TI nem sempre possuem o controle efetivo da infra-estrutura com a qual entregam os serviços aos seus clientes, por isso o gerenciamento de configuração é o processo que ajuda a manter o acompanhamento dos elementos de infra-estrutura necessários para a entrega dos serviços de TI. 2.2.1.2 Gerenciamento de Alterações Um robusto processo de gerenciamento de alterações garante um controle completo das modificações na infra-estrutura de TI, realizando-as com um risco mínimo. O Gerenciamento de Alterações não é apenas o controle das alterações, pois este processo começa com uma solicitação de alteração levantada e mantém o controle da análise de uma solicitação de alteração até a revisão da sua pós-implantação. 2.2.1.3 Gerenciamento de Incidentes/Help Desk Os usuários finais solicitam os serviços de Tecnologia da Informação para melhorar a eficiência dos seus próprios processos de negócio, e por isso, estes usuários precisam de um ponto único de contato com a organização de TI. O Help Desk é o ponto único de contato para os usuários finais, onde todas as perguntas, temas e solicitações são registrados para o seu atendimento. O suporte começa através do processo de gerenciamento de incidentes, que permite que os usuários finais voltem à operação normal de trabalho após uma interrupção dos serviços de TI. 2.2.1.4 Gerenciamento de Problemas O processo de gerenciamento de problemas concentra-se em encontrar os erros conhecidos da infra-estrutura de TI. O Gerenciamento de Problemas também é um processo pró-ativo, ou seja, antes que ocorram os problemas, eles são identificados para sua devida solução. 2.2.1.5 Gerenciamento de Versões Assim que o gerenciamento de alterações aprova uma modificação, ao aplicá-la, o gerenciamento de versões realiza o controle para autorizar essa alteração no ambiente 15 apropriado. Este processo realiza o controle de versões e o controle dos movimentos de software, hardware e de outros componentes da infra-estrutura de um ambiente de desenvolvimento a um ambiente de testes para chegar ao ambiente produtivo. Administra também a Biblioteca Definitiva de Software (DSL em inglês), que armazena todas as cópias mestras do software e administra o Repositório Definitivo de Hardware (DHS em inglês), que é uma área física onde estão partes ou reparos. 2.2.1.6 Gerenciamento de Capacidade O objetivo do gerenciamento de capacidade é garantir que a melhor capacidade da infra-estrutura está na localização correta, para o cliente adequado, no tempo certo e por um preço justo. O processo de gerenciamento de capacidade apresenta uma estreita relação com o gerenciamento de disponibilidade, gerenciamento de configuração e gerenciamento de níveis de serviço. 2.2.1.7 Gerenciamento de Disponibilidade O gerenciamento de disponibilidade é responsável por garantir que os serviços estejam disponíveis, com base nos níveis acordados entre a organização de TI e os clientes. O gerenciamento de disponibilidade apresenta uma estreita relação com o gerenciamento de capacidade para atingir os seus objetivos; esta relação não pode garantir a disponibilidade de um serviço quando a capacidade for insuficiente. 2.2.1.8 Gerenciamento de Finanças Quando os níveis de serviço já estão acordados com os clientes, é necessário conhecer quanto dinheiro será necessário para a entrega dos serviços, especialmente quando os custos pelos serviços de TI serão atribuídos aos clientes, para isto, o gerenciamento de finanças apresenta três sub-processos: Orçamentos, Contabilidade de TI e Encargos. O gerenciamento de finanças requer as informações dos processos de entrega e suporte de serviços com relação aos custos para a entrega dos serviços. 2.2.1.9 Gerenciamento de Continuidade de Serviços de TI O processo de gerenciamento de continuidade de serviços de TI pesquisa, desenvolve e implanta as opções de recuperação quando uma interrupção de um serviço atinge um ponto 16 definido. O cliente decide a opção que será utilizada e forma parte dos contratos de níveis de serviço. 2.2.1.10 Gerenciamento de Níveis de Serviço Este processo oferece o contato entre a organização de TI e o cliente, para garantir que a empresa conhece quais serviços entregará para cumprir os objetivos do negócio. Adicionalmente, este processo garante que o grupo de TI possa entregar, de forma consistente, os serviços ao cliente através de monitoramento e relatórios contínuos. 2.3 MICROSOFT OPERATIONS FRAMEWORK - MOF Como descrito anteriormente, MOF é a base do Operations Manager. O MOF foi desenvolvido pela Microsoft e um grupo de parceiros com o objetivo de expandir as melhores práticas apresentadas pela ITIL. O MOF (Figura 1) inclui um conjunto de recursos que estão disponíveis para ajudar a conquistar a confiabilidade, a gerenciabilidade, a suportabilidade e a disponibilidade com os produtos e tecnologias Microsoft (Prince; Mueller; Fenstermacher, 2007). Segundo Marques (2008), o MOF é um modelo pró-ativo formado por uma integração entre melhores práticas, princípios e atividades. Esta integração busca alcançar uma maior confiabilidade para os serviços e soluções oferecidas pela equipe de TI em uma organização auxiliando na tomada de decisão. Para Marques (2008), o principal objetivo do MOF é ajudar o time de TI na criação, operação e no suporte dos serviços oferecidos assegurando que os investimentos feitos com estes serviços agreguem valor ao negócio com um nível aceitável de risco, criando um ambiente onde a TI e o Negócio trabalhem integrados. Ciclo de Vida de TI descreve a duração, o tempo de vida, de um serviço de TI, desde seu planejamento até sua otimização, abordando as seguintes três fases e uma camada fundamental com atividades que são utilizadas por todo o ciclo (MARQUES, 2008): planejar; entregar; e operar. 17 Figura 1 – O Ciclo de Vida de TI. Além das três fases, tem-se uma camada fundamental chamada Gerenciar (Manage), com atividades que são utilizadas por todo o ciclo. Fundamental, porque é com base nela que todas as três fases irão evoluindo. Esta camada aplica as melhores práticas para assegurar que os investimentos feitos com TI agreguem valor ao negócio com o menor nível aceitável de risco (MARQUES, 2008): • diminuir os riscos através de uma melhor coordenação entre as equipes; • reconhecer implicações de conformidade quando políticas são revisadas; • antecipar e mitigar impactos de confiabilidade; • descobrir problemas de integração em serviços antes de estarem em produção; 18 • prevenir problemas de desempenho antecipadamente; e • adaptação efetiva com novas necessidades de negócio. Segundo Microsoft Operations Framework (2008), as três fases e a camada fundamental são descritas da seguinte maneira: 2.3.1 Fase Planejar A fase Planejar (Figura 2), primeira etapa do ciclo de vida, é onde a TI trabalha alinhada com o Negócio da organização para que seja possível entregar serviços com maior valor visando tornar a empresa mais competitiva, atendendo a estratégia da organização e suas necessidades na busca de confiabilidade. É possível entender as políticas existentes e orientar da melhor forma os investimentos financeiros durante a tomada de decisão, criando uma sintonia integrada entre a estratégia de TI e a estratégia da própria organização. Os profissionais de TI trabalham seguindo as necessidades do negócio da empresa para que o cenário atual seja entendido e os objetivos acertados dentro das capacidades do departamento de TI. Figura 2 - Fase planejar. Durante todas as atividades desta fase o objetivo principal será oferecer orientações para que a equipe de TI possa planejar continuamente as melhorias na estratégia de serviços de TI, 19 garantindo que estes agreguem valor, sejam repetíveis, seguros, estejam em conformidade, mantenham um ótimo custo benefício e se adaptem as necessidades variáveis do negócio. 2.3.2 Fase Entregar A fase Entregar (Figura 3) é a segunda etapa do ciclo de vida de TI, ela começa logo após o término da fase Planejar, nesta etapa encontram-se as atividades necessárias para planejar, desenhar, criar e implementar o serviço ou solução, lembrando que não importa o tamanho da alteração, seja ela pequena ou grande, o ideal é sempre utilizar o ciclo de vida de TI para se guiar durante o projeto. Figura 3 - Fase entregar. Um dos principais objetivos da fase Entregar é garantir que os projetos atuais possam ser bem idealizados, planejados, criados e implementados, sempre de acordo com as necessidades do negócio e as especificações dos clientes. Para isso será necessário coletar os requisitos antes de planejar a solução, preparar o desenho da solução, desenvolver planos de trabalho, estimativas de custos e cronograma de entregáveis. 2.3.3 Fase Operar Nesta terceira fase, a fase Operar (Figura 4), as atividades focam em o que fazer depois que um serviço foi implantado no ambiente de produção. Os processos chave desta fase ajudarão na rotina do dia-a-dia para realizar as operações e as manutenções nos serviços 20 oferecidos por TI, gerenciando cada serviço de forma eficiente e pró-ativa, monitorando a saúde dos serviços de forma contínua e restaurando algum serviço após um eventual problema, por exemplo. Figura 4 - Fase Operar. Esta fase começa logo após um serviço ser colocado em produção. Logo um de seus principais objetivos é garantir que os serviços em produção estão operados, monitorados e suportados seguindo os níveis de serviço (SLA) acordados entre TI e a organização. Para manter os níveis acordados deve se garantir que os serviços estejam disponíveis, suportando a carga de trabalho necessária, que a saúde destes serviços esteja sendo monitorada em tempo real, possibilitando uma recuperação de problemas o mais rápido e eficiente possível. 2.3.4 Camada Gerenciar A camada Gerenciar (Figura 5) faz uma integração entre a tomada de decisão, o gerenciamento de riscos e os processos de gerenciamento de Alterações através de todas as atividades realizadas no decorrer do ciclo de vida de TI. Nesta camada é que fica decidido como cada atividade de TI deve ser coordenada e quais os meios utilizados para realizar cada tarefa, promovendo maior consistência nas escolhas e definições de papéis e funções. 21 Figura 5 – Camada Gerenciar. Entre os objetivos da camada se destaca a importância de estabelecer uma abordagem integrada das atividades de gerenciamento de serviços de TI. Os investimentos com TI devem proporcionar o retorno esperado pela organização, as decisões de investimentos e alocação de recursos devem ser feitas pelas pessoas apropriadas com um nível aceitável de risco através de processos documentados e controlados, sempre através de uma comunicação limpa e direta. Os processos de Governança de TI devem ser explícitos ao mesmo tempo em que compartilham o gerenciamento de riscos com toda organização, assim como as políticas e os controles internos. 2.4 SYSTEM CENTER Como já foi descrito anteriormente, nem o ITIL nem o MOF são relacionados com a tecnologia empregada. O ITIL é uma espécie de manual de boas práticas e o MOF basicamente é a interpretação do ITIL segundo a visão da Microsoft, sendo que o ITIL é mais descritivo e o MOF é mais prescritivo. O System Center é uma família de produtos desenvolvidos pela Microsoft para atender ao ITIL e ao MOF. Antes de citar a linha de produtos System Center, será apresentado como a Microsoft dividiu as etapas de gerenciamento no System Center para ajudar a definir o Gerenciamento de serviços de TI. Segundo Prince, Mueller e Fenstermacher (2007), estas estapas são: Gerenciamento de Operações (Operations Management) 22 Gerenciamento de Alterações (Change Management) Gerenciamento de Configurações (Configuration Management) Gerenciamento de Versões (Release Management) Gerenciamento de Recursos (Asset Management) Gerenciamento de Proteção dos Dados (Data Protection Management) Gerenciamento de Problemas (Problem Management) Gerenciamento de Capacidade (Capacity Management) Gerenciamento de Incidentes (Incident Management) Através de produtos internos, parceiros próximos, e aquisições de software de outras companhias, a Microsoft está desenvolvendo para cada um destas disciplinas um produto da linha System Center, conforme descrito a seguir. System Center Operations Manager O System Center Operations Manager oferece ferramentas para ajudar a monitorar próativamente sua rede como também reduzir a complexidade associada com a administração de uma infra-estrutura de TI. Cobrindo o Gerenciamento de Operações. System Center Configuration Manager O System Center Configuration Manager fornece uma solução completa para o Gerenciamento de Alterações e Gerenciamento de Configuração, também atendendo aos Gerenciamentos de Versões e Gerenciamento de Recursos, já que tem a capacidade de entregar correções e atualizações assim como fazer inventários de softwares e hardwares. System Center Data Protection Manager Data Protection Manager (DPM) é uma ferramenta de backup e recovery da Microsoft. DPM é uma solução de backup centralizada com recuperação rápida e confiável. Cobrindo o Gerenciamento de Proteção dos Dados. System Center Capacity Planner Capacity Planner é uma ferramenta para ser usado em um cenário antes da implantação quando se está sendo planejando uma nova implantação, mudanças de infra-estrutura, ou 23 atualização de versões. Fornecendo um guia de melhores práticas e requisitos de hardware para ajudar planejamento da implantação. Atualmente estão disponíveis modelos para o Exchange 2003 e 2007, para o MOM 2005 e Operations Manager. Auxiliando no Gerenciamento de Capacidade. 2.5 OPERATIONS MANAGER O Gerenciamento de Operações está focado principalmente em garantir que as operações do negócio são eficientes e efetivas através dos processos que são monitorados para melhorar a confiabilidade e a disponibilidade dos sistemas e serviços de TI. Para realizar isto é necessário coletar informações dos sistemas atuais, ter as pessoas adequadas para decifrar os dados e ter os procedimentos adequados para executar qualquer tarefa que poderá ser necessária se existir algum problema efetivo ou em potencial no seu ambiente. (Prince; Mueller; Fenstermacher, 2007). O System Center Operations Manager é um produto que permite centralizar a monitoração de numerosos servidores em Rede. Podem ser monitorados diversos hardwares, produtos de softwares e serviços de rede, por exemplo, Serviço de Diretório como o Active Directory, servidores de banco de Dados como o SQL Server e servidores de Emails como o Exchange Server. O Operations Manager possibilita coletar informações necessárias para reduzir o tempo e esforço em administrar uma infra-estrutura de TI automatizando tarefas com uma visão pró ativa para determinar possíveis problemas. (Prince; Mueller; Fenstermacher, 2007). Marques (2008) afirma que com o Operations Manager é possível ter uma visão consolidada da saúde do ambiente de TI na organização e com isso controlar melhor os custos e aumentar a eficiência da infra-estrutura. Implantar a ferramenta em um ambientes e gerenciar parques de computadores seguindo as melhores práticas de mercado para enfim chegar ao tão desejado nível de excelência operacional. 24 Boa parte dos investimentos com TI é destinada à manutenção, administração de retrabalho relacionado aos sistemas existentes, neste caso pouco sobra deste investimento para aplicar em novas tecnologias (MARQUES, 2008). O Operations Manager é uma ferramenta que pode ser implantada desde pequenas organizações até corporações realmente grandes. Com ele é possível fazer o monitoramento de capacidades de sistemas e computadores, desde o desempenho e eventos até o comportamento de cada dispositivo, considerando um gerenciamento total, de ponta a ponta ou ainda como é comumente chamado end-to-end. Operations Manager auxilia a TI desde processos simples como a geração de um relatório até atividades complexas como auditorias internas e externas (MARQUES, 2008). Com o auxilio do serviço de diretórios Active Directory, o Operations Manager distribui configurações para os agentes instalados nos computadores, delega perfis com permissões diferentes através dos grupos de segurança, autenticação e autorização, reduzindo as tarefas administrativas relacionadas. Desta forma, diversos administradores e operadores podem ter direitos diferentes de utilização para que cada um acesse apenas o que deve acessar. Através do Operations Manager é possível explorar os dados coletados e realizar tarefas relacionadas aos alertas gerados, saber quais os serviços estão ligados com uma determinada falha e ver um histórico do estado dos serviços. Permite, ainda, gerenciar dispositivos através do protocolo SNMP (Simple Network Management Protocol). Isso se aplica á computadores sem o Windows e também a hardware como roteadores e servidores de impressão, por exemplo, os dados são coletados a partir de eventos SNMP. 2.6 COMPONENTES Segundo Fox (2007), a infra-estrutura do Operations Manager é formada por uma série de componentes (Figura 6), cada um dos componentes do Operations Manager tem sua importância, alguns deles são necessários para que o ambiente seja implantado, outros são opcionais. 25 Os componentes necessários para qualquer implantação do Operations Manager é o Management Group, ele é formado pela OperationsManager Database, pelo Root Management Server, pela Operations Console e por um ou mais agentes instalados em servidores monitorados ou equipamentos de rede. Os componentes opcionais entendem a funcionalidade do Management Group. Fox (2007) descreve os componentes da seguinte forma: Figura 6 - Componentes que formam um Management Group. Management Group: É um componente virtual sendo formado pela base de dados Operations Manager, o Root Management Server (RMS) e a Operations Console. Fazem parte deste componente também os Agentes instalados nos computadores monitorados. É possível trabalhar com diversos grupos no caso de ambientes muito grandes ou específicos. Operations Manager Database: É a base de dados que guarda todas as configurações e dados de um Management Group. Root Management Server (RMS): Primeiro Management Server instalado no Management Group, pode haver apenas um para cada grupo. O primeiro Management Server será automaticamente reconhecido como o Principal (chamado de Root). Este componente é o ponto principal de configuração em um Management Group, através dele é possível administrar e se comunicar com os agentes instalados em outro computador, é possível se comunicar com a Operations Manager Database e com outros Management Servers. 26 Agent: O agente é o componente que deverá ser instalado em todos os computadores a serem gerenciados pelo Operations Manager. Ele funciona como um serviço que relata ao servidor a saúde do computador que está sendo monitorado. Basicamente um agente recebe de um Management Server as configurações de o que ele deverá coletar e enviar de volta. Operations Console: É um ponto centralizado de interação com o Operations Manager, através da console o administrador e/ou operador pode realizar as mais diversas tarefas do dia-a-dia. Management Packs: São pacotes que contêm uma série de definições que servirão de base para o monitoramento da saúde de alguma aplicação. Management Server: A partir do segundo Management Server que for instalado no grupo ele será um Management Server adicional em caso de necessidade um Management Server poderá ser promovido a RMS, quando um RMS falha. Gateway Server: Servidor utilizado para manter a comunicação entre agentes e outros servidores quando eles não estão no mesmo domínio ou separados por limites que não têm nenhuma relação de confiança. Ele recebe todas as informações dos agentes em determinada localidade e depois faz uma comunicação segura com Management Servers que estão dentro do grupo, repassando então os dados coletados dos agentes. A autenticação no Operations Manager é feita através do protocolo Kerberos, seja agent-to-server ou server-to-agent. Web Console Server: É um componente que possibilita realizar quase todas as tarefas de uma Operation Console, mas através do navegador, a grande vantagem é a mobilidade que este componente oferece. Proxy Agent: Serve como um Proxy para monitorar dispositivos que não podem de alguma forma receber o agente do Operations Manager. Por exemplo, existem alguns dispositivos como hardwares ou computadores que não têm o Windows instalado e em muitas casos dispositivos que não têm nem sistema operacional, assim o Operations Manager faz o monitoramento através do protocolo SNMPv2 e para que isso seja possível um computador com o Windows que tenha o agente instalado recebe uma 27 configuração no próprio agente que o identifica como um proxy agent e a partir dai este computador monitora o dispositivo em questão e envia os dados para o Management Server. Command Shell: É uma console que permite executar scripts baseados no Windows PowerShell, esta funcionalidade ajuda e muito quando é necessário automatizar tarefas do dia-a-dia. Reporting Data Warehouse: É uma base de dados que guarda os alertas e os dados de monitoração enviados para um Management Server mantendo informações históricas para gerar relatórios. Quando um Management Server grava dados em uma Operations Manager Database estas mesmas informações são automaticamente gravadas no Data Warehouse também, se mantendo sempre atualizado. O Reporting Data Warehouse pode receber dados de diversos Management Groups ao mesmo tempo, caso a organização tenha mais de um grupo. Reporting Server: Este é o componente responsável por gerar os relatórios com os dados que estão armazenados no Data Warehouse. Audit Collection Services (ACS): É uma base de dados para guardar log de eventos de segurança (Security Event Log) dos computadores. Este componente é utilizado para monitorar os eventos de log de segurança em Controladores de Domínio. ACS Database: Todos os logs já processados pelo ACS Collector Server são guardados nesta base de dados. Dependendo da quantidade de logs e computadores monitorados esta base pode chegar a ter 100gb de espaço dedicado. É recomendada que seja feita com a versão Enterprise do SQL Server 2005. ACS Forwarder: É uma funcionalidade que deve ser habilitada no agente. Apenas nos agentes instalados nos servidores que você vai querer que alimente a ACS Database com os logs de segurança. ACS Collector Server: Este é um componente que serve como filtro para os logs enviados pelo ACS Forwarder antes que eles cheguem até o ACS Database. Este componente que receberá os logs de segurança, filtrará e processará para que ao serem 28 enviados para a ACS Database já estejam de acordo com as definições feitas pela organização. ACS Reporting: é um servidor de relatórios para a base ACS. 2.7 REQUISITOS Ao planejar uma solução com o Operations Manager para um ambiente além de conhecer cada componente que fará parte do Management Group é necessário também conhecer os requisitos para que estes componentes funcionem satisfatoriamente. Para cada componente existe uma necessidade de hardware e de software. Como base nas sugestões da Microsoft em sua documentação foi feito uma média com relação uma implantação que monitora entre 15 e 250 servidores. (MARQUES, 2008). 2.7.1 Base de dados OperationsManager A OperationsManager database é onde são guardadas todas as configurações e dados de monitoração de um Management Group. Os requisitos para hospedar a OperationsManager Database estão apresentadas na Tabela 1. Como todas as bases de dados de aplicações, o que mais influencia no desempenho da OperationsManager Database é o sistema de disco. Visto que todos os dados passam pela base de dados, quanto mais rápidos os discos, melhor será o desempenho. CPU e memória também afetam o desempenho (FOX, 2007). Tabela 1 - Requisitos da base OperationsManager Processador 2.8GHz 32 ou 64 Bits ou mais rápido Memória 4 GB ou mais Espaço em Disco 50 GB livres Sistema Operacional Windows Server 2003 SP1/SP2 Standard/Enterprise 32/64 Bits Windows Server 2003 R2 SP1/SP2 Standard/Enterprise 32/64 Bits Banco de Dados SQL Server 2005 Standard/Enterprise com SP2 ou superior 29 2.7.2 Root Management Server (RMS) e Management Server (MS) Para o RMS, o primeiro Management Server instalado no Management Group, o recurso mais crítico é o CPU e a memória. Já para os Management Servers a maior parte da carga é a coleta de dados operacionais dos agentes e a inserção desses dados coletados nas bases OperationsManager e Data Warehouse. A maior parte dessas operações são feitas usando enfileiramento na memória em vez de depender de um sistema de disco lento, sendo assim o recurso mais critico é a memória. (FOX, 2007) Os requisitos para implantar o RMS e o MS estão apresentadas na Tabela 2: Tabela 2 - Requisitos do RMS e MS Processador 2.8GHz 32 ou 64 Bits ou mais rápido Memória Sendo um RMS 4GB ou mais, sendo um MS 2GB ou mais Espaço em Disco 20 GB livres Sistema Operacional Windows Server 2003 SP1/SP2 Standard/Enterprise 32/64 Bits Windows Server 2003 R2 SP1/SP2 Standard/Enterprise 32/64 Bits Programas e Aplicativos .Net Framework versão 2.0 e 3.0 Microsoft Core XML Services Versão 6.0 2.7.3 Operations Console A Operations Console é o ponto centralizado de interação (Administração) com o Operations Manager e os seus requisitos são apresentados na Tabela 3. Tabela 3 - Requisitos para a Operations Console Processador 2.8GHz 32 ou 64 Bits ou mais rápido Memória 2GB ou mais Espaço em Disco 5 GB livres Sistema Operacional Windows Server 2003 SP1/SP2 Standard/Enterprise 32/64 Bits Windows Server 2003 R2 SP1/SP2 Standard/Enterprise 32/64 Bits Windows XP SP2 Professional 32/64 Bits Windows Vista Ultimate/Business/Enterprise 32/64 Bits 30 Programas e Aplicativos .Net Framework versão 2.0 e 3.0 Power Shell Versão 1.0 2.7.4 Agente O agente é o componente que deve ser instalado nos computadores a serem gerenciados pelo Operations Manager. Os requisitos para o agente ser instalado em um servidor são apresentado na Tabela 4. Tabela 4 - Requisitos para o Agente Processador X86, x64 ou IA-64 com os requisitos mínimos para S.O. Memória Requisitos mínimos para o Sistema Operacional Espaço em Disco 30 MB livres Sistema Operacional Windows Server 2003 SP1/SP2 Standard/Enterprise 32/64 Bits Windows Server 2003 R2 SP1/SP2 Standard/Enterprise 32/64 Bits Windows 2000 SP4 Server/Professional Windows XP SP2 Professional 32/64 Bits Windows Vista Ultimate/Business/Enterprise 32/64 Bits Programas e Aplicativos Microsoft Core XML Services Versão 6.0 Windows Installer Versão 3.1 2.7.5 Reporting Server O Reporting Server é o componente responsável por gerar os relatórios com os dados da base Data Warehouse. E seus requisitos são apresentados na Tabela 5. Tabela 5 - Requisitos do Reporting Server Processador 2.8GHz 32 ou 64 Bits ou mais rápido Memória 2GB ou mais Espaço em Disco 20 GB livres Sistema Operacional Windows Server 2003 SP1/SP2 Standard/Enterprise 32/64 Bits Windows Server 2003 R2 SP1/SP2 Standard/Enterprise 32/64 Bits 31 Programas e Aplicativos .Net Framework versão 3.0 2.7.6 Reporting Data Warehouse A Data Warehouse é base de dados que guarda os dados e alertas para gerar relatórios (histórico). Os requisitos para hospedar a base Data Warehouse estão apresentadas na Tabela 6. No Operations Manager os dados são gravados na Data Warehouse quase em tempo real, por tanto o uso de recursos se torna muito similar ao da OperationsManager Database. O desempenho do sistema de discos é o mais critico seguido pelo desempenho da memória e da CPU. (FOX, 2007) Tabela 6 - Requisitos para o Reporting Data Warehouse Processador 2.8GHz 32 ou 64 Bits ou mais rápido Memória 4GB ou mais Espaço em Disco 100 GB livres Sistema Operacional Windows Server 2003 SP1/SP2 Standard/Enterprise 32/64 Bits Windows Server 2003 R2 SP1/SP2 Standard/Enterprise 32/64 Bits Programas e Aplicativos Internet Information Server 6 2.7.7 Audit Collection Services (ACS) O ACS é uma base de dados que guarda log de eventos de segurança (Security Event Log). Os requisitos para hospedar essa base de dados estão apresentadas na Tabela 7. Tabela 7 - Requisitos para o ACS Processador 2.8GHz 32 ou 64 Bits ou mais rápido Memória 4 GB ou mais Espaço em Disco 200 GB livres (2 discos em RAID 1) Sistema Operacional Windows Server 2003 SP1/SP2 Standard/Enterprise 32/64 Bits Windows Server 2003 R2 SP1/SP2 Standard/Enterprise 32/64 Bits Programas e Aplicativos SQL Server 2005 Enterprise com SP2 32 2.8 TOPOLOGIA No Operations Manager podem ser implantados todos os componentes principais em um único servidor que não está sendo utilizado se o hardware suportar, como é ilustrado na Figura 7. Ou então distribuir esses componentes nos servidores já existentes combinando alguns componentes em um mesmo servidor. Usando o servidor de banco existente para hospedar as bases, por exemplo, como na Figura 8. Figura 7 - Componentes Instalados num mesmo Servidor Figura 8 - Componentes Distribuídos 33 O Operations Manager exige sempre uma autenticação mutua entre os seus componentes. O Kerberos é usado por padrão, mas a autenticação baseada em certificados pode ser usada no caso de servidores que estiverem em outros domínios ou em um grupo de trabalho. O protocolo Kerberos somente suporta autenticação, como parte do processo de autenticação, uma chave é negociada entre o cliente e o servidor, que é usada para criptografar futuras comunicações entre o cliente e o servidor. É requerido que as mensagens sejam criptografadas, mas sem especificar exatamente quais algoritmos de criptografia serão usados para criptografar as mensagens. O Windows irá determinar qual algoritmo usar baseado nas configurações das diretivas de grupo do domínio e baseado no que é suportado pelo cliente e pelo servidor. Se em algum momento o Windows adicionar suporte a um novo algoritmo de criptografia e ambos cliente e servidor suportarem, então o Windows está livre para começar a usa-ló. Sendo que o algoritmo a ser usado será negociado por secção e é possível que diferentes secções usem algoritmos diferentes dependendo de quais são suportados pelos agentes. Todas as Databases usam a porta 1433, incluindo a ACS database. A única diferença entre a operational database, a data warehouse e a ACS database é que a ACS database usa ODBC em vez de OLE DB para comunicar com o Management Server. A porta 5723 é usada para a comunicação entre o RMS e o MS. Como é apresentado na Figura 9. O Gateway Server permite monitorar agents em servidores em grupos de trabalho (workgroups), através de one-way trusted e untrusted domains. Possibilitando a comunicação entre o servidor alvo e o Management Server. Em um ambiente com Grupo de Trabalho será necessário instalar certificados para possibilitar a autenticação mútua necessária para comunicar com o Gateway Server, como é ilustrado na Figura 10. 34 Figura 9 - Portas e Protocolos utilizados Num ambiente com domínio o Gateway Server é instalado num servidor no mesmo domínio em que os servidores alvos estão inseridos. O Gateway Server se torna o responsável por encontrar os servidores alvos. Se o Management Server onde o Gateway Server está conectado falhar pode ser configurado um segundo Management Server parar redundância. Assim como no agente pode ser configurado um segundo Gateway Server se o primeiro falhar. A comunicação de dados entre o Management Server e o Gateway Server é criptografada. 35 Figura 10 - Domínios sem relação de confiança Instalar agentes em um domínio sem relação de confiança e separados por um firewall pode ser complicado. E é onde o Gateway Server pode ser utilizado. Por exemplo, sejam dois domínios, Domínio A e domínio B. Não tem relação de confiança entre eles e um firewall separa os dois domínios. Nesse cenário sem um Gateway Server, seria necessário configurar um certificado em cada agente. O Gateway Server faz o papel de um agente mais poderoso que é responsável em distribuir workflow, receber dados dos agentes em domínios sem relação de confiança e encaminhar os dados para um management Server. Com o Gateway Server só é necessário fazer a configuração entre ele e o management Server, que geralmente é menos trabalho que configurar todos os agentes. Um Gateway Server é essencialmente um Management Server sem a conexão com as databases. 36 3 METODOLOGIA A metodologia do presente trabalho pode ser classificada com base nos objetivos e com base nos procedimentos técnicos adotados. De acordo com os objetivos, este trabalho pode ser classificado como pesquisa exploratória e pesquisa descritiva. Pesquisa exploratória porque tem como objetivo o aprimoramento do processo de monitoramento de serviços. Pesquisa descritiva porque descreve os processos de implantação e funcionamento do Operations Manager. De acordo com os procedimentos técnicos adotados, esta pesquisa pode ser classificada como pesquisa bibliográfica e estudo de caso. Pesquisa bibliográfica porque parte deste trabalho foi desenvolvida a partir de livros, manuais e outros trabalhos acadêmicos. Estudo de caso porque foi realizado um estudo completo, no que diz respeito implantação do Operations Manager em uma empresa prestadora de serviços de Tecnologia de Informação. 3.1 FASES DO TRABALHO Com a intenção de facilitar a apresentação dos resultados, o presente trabalho se divide em: Fase 1 - Estudo do Operations Manager: A etapa inicial deste trabalho constituiu uma pesquisa bibliográfica através de manuais do Operations Manager, visando o entendimento das características, componentes e funções do sistema. Fase 2 - Análise da infra-estrutura de rede: através de reuniões com a administração foi diagnosticada a atual situação da infra-estrutura de servidores e serviço da empresa. Em seguida foram determinados todos os serviços a serem monitorados e os objetivos desses monitoramentos. Fase 3 - Cenário de Implantação: O cenário (topologia) de implantação do Operations Manager foi definido considerando a atual infra-estrutura da empresa (capacidade de servidores) e os objetivos definidos para monitoramento. Fase 4 - Instalação do Operations Manager: A instalação do Operations Manager foi realizada conforme a sugestão do manual do sistema (Deployment Guide): 37 a. base de dados operacional; b. Managemant Server; c. base de dados de relatórios; d. Reporting Server; e. console operacional; f. agentes; g. Management packs. Fase 5 - Análise: Após a instalação do Operations Manager, foi realizada uma análise do funcionamento do sistema, possibilitando tomar algumas ações corretivas melhorar e adequar o funcionamento. 38 4 ANÁLISE E DISCUSSÃO DOS RESULTADOS A estruturação da apresentação dos resultados se dará da seguinte forma: levantamentos de dados obtidos através do diagnóstico da infra-estrutura da empresa prestadora de serviços de TI estudada; apresentação dos serviços a serem monitorados pelo Operation Manager; o cenário de implantação; descrição dos procedimentos de instalação do Operation Manager; e, finalizando, será apresentado uma análise do funcionamento do Operation Manager na empresa estudada. 4.1 A INFRA ESTRUTURA A empresa prestadora de serviços de Tecnologia da Informação estudada está presente à oito anos no mercado. Conta com uma estruturada equipe de administração e suporte a sistemas operacionais e redes. A empresa supre as necessidades de manutenção e atualização de sistemas de clientes de todo o Brasil, dos mais diversos segmentos de atuação. Fica localizada na região do Vale do Itajaí/SC, porém dispõe de tecnologia e mobilidade para atuar independente do posicionamento geográfico. Sua equipe possui certificações nos níveis MCP (Microsoft Certified Professional), MCSA (Microsoft Certified Systems Administrator) e MCSE (Microsoft Certified Systems Engineer), o que possibilitou a conquista da certificação corporativa Microsoft Certified Partner em 2001 e, em 2005, a certificação corporativa Microsoft Gold Certified Partner. A empresa oferece serviços de monitoramento, apoio, suporte para seus clientes, 24 horas por dia, 7 dias por semana, 365 dias por ano, Projetos e Licenciamento. 4.1.1 Especificações do Ambiente da Empresa Prestadora de Serviços O levantamento da infra estrutura apresentou que a empresa prestadora de serviços dispõe de oito servidores, todos localizados na cidade de Blumenau/SC. O ambiente da empresa tem a configuração dos seus servidores apresentadas nas Tabelas 8 e 9, uma listando os servidores físicos e a outra, os virtuais. 39 Tabela 8 - Servidores físicos. Nome SRV-BNU101 RAM 4GB Processador Dual-Core AMD Opteron™ Processor 2210, 1800 Mhz SRV-BNU301 4GB Dual-Core AMD Opteron™ Processor 2210, 1800 Mhz SRV-BNU501 4GB Dual-Core AMD Opteron™ Processor 2210, 1800 Mhz SRV-BNU502 4GB Dual-Core AMD Opteron™ Processor 2210, 1800 Mhz SRV-BNU401 1GB Pentium D 2,8Ghz Discos 2 x 250Gb SATA em RAID 1 2 x 250Gb SATA em RAID 1 2 x 250Gb SATA em RAID 1 2 x 250Gb SATA em RAID 1 2 x 120Gb SATA em RAID 1 Tabela 9 - Servidores Virtuais. Nome VSRV-BNU102 VSRV-BNU202 VSRV-BNU201 Memória Reservada 1 GB 512 MB 2 GB Virtualizado no servidor SRV-BNU501 SRV-BNU501 SRV-BNU502 Os servidores executam papéis distintos para distribuição de carga. Os softwares instalados e as funções principais de cada servidor são: SRV-BNU101: Microsoft Exchange Server 2007: correio e colaboração; Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory); DNS Interno: serviço para resolução de endereços de DNS Interno; WINS: serviço para resolução de endereços NetBIOS Interno; DHCP: serviço para configurações de rede dinâmicas; File Server: servidor de arquivos; Microsoft Internet Information Services (IIS); Microsoft Forefront Server Security:Antivirus para Exchange; e Windows Server 2003 Standard Edition R2 x64: sistema operacional. 40 VSRV-BNU102: Microsoft Internet Information Services (IIS); Controlador de domínio secundário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory); WINS: serviço para resolução de endereços NetBIOS Interno; Servidor de Impressão; e Windows Server 2003 Standard Edition: sistema operacional. VSRV-BNU201: Microsoft Internet Information Services (IIS); Servidor de aplicação (CRM); Antivirus para SharePoint; e Windows Server 2003 Standard Edition: sistema operacional. VSRV-BNU202: Servidor de aplicação (Prometric); e Windows Server 2003 Standard Edition: sistema operacional. SRV-BNU301: Microsoft Internet Information Services (IIS); Microsoft SQL Server 2005: banco de dados relacional; e Windows Server 2003 Standard Edition R2 x64: sistema operacional. SRV-BNU501: Microsoft Internet Information Services (IIS); Microsoft Virtual Server 2005 R2; e Windows Server 2003 Standard Edition R2 x64: sistema operacional. 41 SRV-BNU502: Microsoft Internet Information Services (IIS); Microsoft Virtual Server 2005 R2; e Windows Server 2003 Standard Edition R2 x64: sistema operacional. SRV-BNU401: Microsoft ISA Server 2006: serviços de Firewall, controle de acesso Web (Proxy), publicação de serviços e acesso remoto via VPN; DNS Externo: gerenciamento e controle dos registros de DNS para publicação externa; DHCP: Servidor para distribuição de nomes; e Windows Server 2003 Standard Edition R2: sistema operacional. 4.1.2 Especificações dos Ambientes dos Clientes Para realizar a instalação do Operation Manager fez-se necessário, ainda, fazer um levantamento das especificações dos ambientes dos clientes da empresa prestadora de serviço. Neste sentido, a Tabela 10 apresenta o numero de servidores dos clientes que solicitaram os serviços de monitoramento, cidade e estado. Tabela 10 – Servidores a serem monitorados pela empresa prestadora de serviço. Empresa Nº de Servidores Monitorados Cidade Estado Cliente 01 1 Chapecó Santa Catarina Cliente 02 3 Blumenau Santa Catarina Cliente 03 1 Blumenau Santa Catarina Cliente 04 3 Blumenau Santa Catarina Cliente 05 1 Barueri São Paulo Cliente 06 1 Para de Minas Minas Gerais Cliente 07 1 Pinheiro Maranhão 42 Cliente 08 1 Blumenau Santa Catarina Cliente 09 1 Carpina Pernambuco Cliente 10 1 Blumenau Santa Catarina Cliente 11 5 Blumenau Santa Catarina Cliente 12 3 Campinas São Paulo Cliente 13 1 Blumenau Santa Catarina Cliente 14 4 Florianópolis Santa Catarina Cliente 15 1 Joinville Santa Catarina Cliente 16 1 Blumenau Santa Catarina Cliente 17 1 Arapiraca Alagoas O levantamento mostrou que, inicialmente, seriam 30 servidores de clientes a serem monitorados, espalhados por todo o território brasileiro. São servidores com serviços de redes distintos, que cada cliente julga ser essencial para o funcionamento da sua empresa. Em resumo seus softwares instalados e funções principais são: Cliente 01: O cliente 01 está localizado na cidade de Chapecó – SC. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por Server01, que apresenta as seguintes funções: Funções do Server01: Microsoft Exchange Server 2007: correio e colaboração. Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. WINS: serviço para resolução de endereços NetBIOS Interno. Microsoft Internet Information Services (IIS). Microsoft Forefront Server Security:Antivirus para Exchange. Windows Server 2003 Standard Edition R2 x64: sistema operacional. 43 Cliente 02: O cliente 02 está localizado na cidade de Blumenau – SC. Este cliente solicitou o monitoramento de três servidores, nomeados por SRV101, SRV201 e SRV301, que apresentam as seguintes funções: Funções do SRV101: Microsoft Exchange Server 2007: correio e colaboração. Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition R2 x64: sistema operacional. Funções do SRV201: DNS Interno: serviço para resolução de endereços de DNS Interno. WINS: serviço para resolução de endereços NetBIOS Interno. Microsoft Internet Information Services (IIS). Microsoft Windows Server Update Services (WSUS) Microsoft SQL Server 2005: banco de dados relacional. Windows Server 2003 Standard Edition R2 x64: sistema operacional. Funções do SRV301: Microsoft Internet Information Services (IIS). Microsoft SQL Server 2005: banco de dados relacional. Windows Server 2003 Standard Edition R2: sistema operacional. Cliente 03: O cliente 03 está localizado na cidade de Blumenau – SC. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por Fileserver, que apresenta as seguintes funções: Funções do Fileserver: Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. 44 WINS: serviço para resolução de endereços NetBIOS Interno. File Server: servidor de arquivos. Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition R2: sistema operacional. Cliente 04: O cliente 04 está localizado na cidade de Blumenau – SC. Este cliente demonstrou interesse em monitorar três servidores, nomeados por WTS03, WTS04 e WTS05, que apresentam as seguintes funções: Funções do WTS03: Windows Terminal Services (WTS) Windows Server 2003 Standard Edition R2: sistema operacional. Funções do WTS04: Windows Terminal Services (WTS) Windows Server 2003 Standard Edition R2: sistema operacional. Funções do WTS05: Windows Terminal Services (WTS) Windows Server 2003 Standard Edition R2: sistema operacional. Cliente 05: O cliente 05 está localizado na cidade de Blumenau – SC. Este cliente solicitou o monitoramento de apenas um servidor, nomeado por Server03, que apresenta as seguintes funções: Funções do Server03: Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. Microsoft Internet Information Services (IIS). 45 Microsoft SQL Server 2000 Windows 2000 Server Standard Edition: sistema operacional. Cliente 06: O cliente 06 está localizado na cidade de Para de Minas – MG. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por SERVER, que apresenta as seguintes funções: Funções do SERVER: Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. WINS: serviço para resolução de endereços NetBIOS Interno. DHCP: serviço para configurações de rede dinâmico. Microsoft Internet Information Services (IIS). Microsoft SQL Server 2000 Windows 2000 Server Standard Edition: sistema operacional. Cliente 07: O cliente 07 está localizado na cidade de Pinheiro – MA. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por servweb, que apresenta as seguintes funções: Funções do Servweb: Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. DHCP: serviço para configurações de rede dinâmico. Microsoft Internet Information Services (IIS). Microsoft SQL Server 2000 Windows Server 2003 Standard Edition: sistema operacional. 46 Cliente 08: O cliente 08 está localizado na cidade de Blumenau – SC. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por SRV-BD, que apresenta as seguintes funções: Funções do SRV-BD: Microsoft Internet Information Services (IIS). Microsoft SQL Server 2005: banco de dados relacional. Windows Server 2003 Standard Edition: sistema operacional. Cliente 09: O cliente 09 está localizado na cidade de Carpina – PE. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por SERVERBD, que apresenta as seguintes funções: Funções do SERVERBD: Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. DHCP: serviço para configurações de rede dinâmico. WINS: serviço para resolução de endereços NetBIOS Interno. Microsoft Internet Information Services (IIS). Microsoft SQL Server 2000 Windows Server 2003 Standard Edition: sistema operacional. Cliente 10: O cliente 10 está localizado na cidade de Blumenau – SC. Este cliente solicitou o monitoramento de apenas um servidor, nomeado por SERVER03, que apresenta as seguintes funções: Funções do Server03: Microsoft Exchange Server 2003: correio e colaboração. Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. DHCP: serviço para configurações de rede dinâmico. 47 Microsoft Internet Information Services (IIS). Microsoft SQL Server 2000 Windows Server 2003 Standard Edition: sistema operacional. Cliente 11: O cliente 11 está localizado na cidade de Blumenau – SC. Este cliente demonstrou interesse em monitorar cinco servidores, nomeados por SRV01, SRV02, SRV03, SRV05 e SRV06, que apresentam as seguintes funções: Funções do Srv01: Microsoft Exchange Server 2003: correio e colaboração. Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition: sistema operacional. Funções do Srv02: Microsoft Internet Information Services (IIS). Microsoft SQL Server 2000 Microsoft SQL Server 2005 Windows Server 2003 Standard Edition: sistema operacional. Funções do Srv03: Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition: sistema operacional. Funções do Srv05: Microsoft Internet Information Services (IIS). Microsoft Virtual Server 2005 R2. Windows Server 2003 Standard Edition: sistema operacional. 48 Funções do Srv06: Controlador de domínio: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. WINS: serviço para resolução de endereços NetBIOS Interno. Microsoft Internet Information Services (IIS). Microsoft Windows Server Update Services (WSUS) Windows Server 2003 Standard Edition: sistema operacional. Cliente 12: O cliente 12 está localizado na cidade de Campinas – SP. Este cliente solicitou o monitoramento de três servidores, nomeados por srvbd, srvweb e srvpool, que apresentam as seguintes funções: Funções do Srvbd: Microsoft Internet Information Services (IIS). Microsoft SQL Server 2005 Windows Server 2003 Standard Edition: sistema operacional. Funções do Srvweb: Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition: sistema operacional. Funções do Srvpool: Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition: sistema operacional. Cliente 13: O cliente 13 está localizado na cidade de Blumenau – SC. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por WTSSERVER, que apresenta as seguintes funções: Funções do Wtsserver: 49 Windows Terminal Services (WTS) Windows Server 2003 Standard Edition R2: sistema operacional. Cliente 14: O cliente 14 está localizado na cidade de Florianópolis – SC. Este cliente demonstrou interesse em monitorar três servidores, nomeados por Dados, Firewall, Web e Mail, que apresentam as seguintes funções: Funções do Dados: Microsoft Internet Information Services (IIS). Microsoft SQL Server 2005: banco de dados relacional. Windows Server 2003 Standard Edition R2 x64: sistema operacional. Funções do Firewall: Microsoft ISA Server 2006: serviços de Firewall, controle de acesso Web (Proxy), publicação de serviços e acesso remoto via VPN. DNS Externo: gerenciamento e controle dos registros de DNS para os domínios externos. DHCP: Servidor para distribuição de nomes. Windows Server 2003 Standard Edition R2: sistema operacional. Funções do Web: Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition: sistema operacional. Funções do Mail: Microsoft Exchange Server 2007: correio e colaboração. Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. WINS: serviço para resolução de endereços NetBIOS Interno. 50 DHCP: serviço para configurações de rede dinâmico. Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition R2 x64: sistema operacional. Cliente 15: O cliente 15 está localizado na cidade de Joinville – SC. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por SERVER, que apresenta as seguintes funções: Funções do Server: Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. DHCP: serviço para configurações de rede dinâmico. Microsoft Internet Information Services (IIS). Windows Server 2003 Standard Edition: sistema operacional. Cliente 16: O cliente 16 está localizado na cidade de Blumenau – SC. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por SRV, que apresenta as seguintes funções: Funções do SRV: Microsoft Exchange Server 2003: correio e colaboração. Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. WINS: serviço para resolução de endereços NetBIOS Interno. DHCP: serviço para configurações de rede dinâmico. Microsoft Internet Information Services (IIS). Microsoft SQL Server 2000 51 Windows Small Business Server 2003: sistema operacional. Cliente 17: O cliente 17 está localizado na cidade de Arapiraca – PE. Este cliente demonstrou interesse em monitorar apenas um servidor, nomeado por SRVSL, que apresenta as seguintes funções: Funções do SRVSL: Controlador de domínio primário: gerenciamento centralizado de usuários, controle de acesso aos recursos da rede, aplicação de diretivas de segurança para estações, etc. (Active Directory). DNS Interno: serviço para resolução de endereços de DNS Interno. WINS: serviço para resolução de endereços NetBIOS Interno. Microsoft Internet Information Services (IIS). Microsoft SQL Server 2000 Windows 2000 Server Standard Edition: sistema operacional. 4.2 SERVIÇOS MONITORADOS As escolhas dos serviços a serem monitorados foram realizadas levando em consideração as necessidades dos clientes. Em consenso com a administração da empresa prestadora de serviços, decidiu-se monitorar somente os serviços essenciais para que as organizações/clientes pudessem desempenhar suas tarefas e prover os serviços oferecidos com excelência. Servidores de E-mails Exchange 2003 e 2007: Monitoramento de serviços relacionados com o Exchange, monitoramento da fila de emails de entrada e saída, testes de envio de e-mail e logon, Status da Mailbox database, monitoramento das configurações do Exchange e melhores práticas relacionadas. Relatórios de desempenho, disponibilidade, e mudanças na configuração. Servidores de Banco de Dados SQL Server 2000 e 2005: Monitoramento do tamanho, espaço livre e crescimento das bases; monitoramento de replicação de bases; monitoramento de tarefas do SQL agent; monitoramento de processos bloqueados ou rodando 52 por um longo tempo; monitoramento de mudanças nas configurações e desempenho em geral do servidor SQL. Serviço de diretórios Active Directory: Monitoramento em tempo real dos eventos e do desempenho; serviços relacionados; disponibilidade; monitoramento do desempenho e saúde da replicação entre ADs; monitoramento do tamanho e do crescimento da Database e do log. Microsoft Internet Information Services (IIS): Monitoramento da saúde, disponibilidade e desempenho do servidor IIS; da saúde, disponibilidade e desempenho de sites Web, FTP, SMTP e NNTP Windows Server 2000 e 2003: Monitoramento do desempenho e da disponibilidade do sistema operacional, detectando alertas, prevenir falta de espaço em disco e problemas no sistema. Windows Terminal Services 2000 e 2003: Disponibilidade, saúde e desempenho dos componentes dos serviços de terminal. Monitoramento de sessões ativas e inativas; serviços essenciais; monitorar licenças de TS; Serviços DNS: Disponibilidade do serviço de DNS, problemas de configuração, transferência de Zonas de DNS. Serviços DHCP: Monitoramento de eventos, disponibilidade, e IPs disponíveis no escopo. Link de internet: Monitorar a disponibilidade do Link de internet. 4.3 CENÁRIO DE IMPLANTAÇÃO O cenário de implantação foi definido para atender o monitoramento dos serviços listados no item 4.2 e, ainda, monitorar a disponibilidade dos servidores, possibilitar o acesso externo as informações e entregar relatórios mensais de desempenho para os clientes. Para atender os objetivos ficou estabelecido instalar: 53 1. Os componentes básicos: Management Group, formado pela OperationsManager Database, pelo Root Management Server, pela Operations Console e por um ou mais agentes instalados em servidores monitorados ou equipamentos de rede. 2. Os componentes opcionais: Para a criação de relatórios mensais, a Data Warehouse database e o Report Server; a Webconsole como uma alternativa ao uso da Operations Console e para utilização externa; e o Command Shell, para automatização de tarefas. A Figura 11 é apresenta uma referência gráfica dos componentes. Agent Report Server Management Server Webconsole Operations Manager Data Warehouse Figura 11 - Representação dos Componentes Ficou estabelecida a criação de uma máquina virtual no servidor srv-bnu501 com 2 Gb de memória para hospedar o primeiro Manager Server, o Root Management Server (RMS). Sendo que é o srv-bnu501 o servidor de virtualização com mais memória disponível. Ficou definido ainda que o novo servidor seja chamado de vsrv-bnu203, conforme o padrão de nomes adotado pela empresa prestadora de serviço - ―Tipo‖ + ―Local‖ + ―Função e/ou sequência‖. O prefixo vsrv significa que é um servidor virtual, bnu sugere o local onde está localizada em Blumenau e 2 (dois) porque ele é um servidor de aplicação e 03 é o terceiro servidor de aplicação a ser criado. Na Tabela 11 é apresentado os códigos segundo as funções. 54 Tabela 11 - Relação de Função e Código Função Código Servidor de Correio 1 Servidor de Aplicação 2 Servidor de Banco de dados 3 Servidor de Firewall 4 Servidor de Virtualização 5 Definiu-se que a OperationsManager database seja criada no servidor SRV-BNU301, que já é o servidor de banco de dados da empresa prestadora de serviços O servidor SRVBNU301 hospedará ainda a Data Warehouse. Para hospedar a Operations Manager Data Warehouse database no SRV-BNU301 é necessário criar outra instância no SQL Server, uma vez que o Reporting Server da instância padrão já está sendo usado por outra aplicação. As consoles serão manualmente instaladas em cinco estações da equipe de suporte. E a Webconsole será instalada no vsrv-bnu203. A distribuição dos componentes está ilustrada na Figura 12. VSRV-BNU203 SRV-BNU301 Figura 12 - Distribuição dos Componentes Para os servidores internos, os agentes poderão ser instalados através da Operations Console, que permite fazer uma busca no AD e escolher os servidores que receberão o agente. Já os servidores dos clientes não estão no mesmo domínio e nem num domínio com relações de confiança com o domínio da empresa. Sendo assim, há duas soluções para a instalação em 55 domínios sem relação de confiança. O primeiro é instalar manualmente um Gateway Server em cada domínio de cliente e, através dele, instalar o agente nos servidores a serem monitorados. O segundo método é instalar o agente manualmente em cada servidor a ser monitorado, um método bem mais trabalhoso que o primeiro. Ambos requerem uma Autoridade de Certificação (CA) para uma autenticação mutua com o Management Server. Essa Autoridade de Certificação (CA) será criada no servidor vsrv-bnu203 do Root Management Server. O Gateway Server tem os mesmos requisitos de um Management Server, sendo assim, ao instalar em um cliente, estaria prejudicando, de certa forma, o desempenho do servidor em que o Gateway Server estaria instalado. Como a intenção é alterar o mínimo possível, foi optado pelo segundo método, apesar de ser mais trabalhoso: o agente se comunica direto com o Management Server, sem depender dos Gateways Server, além disso, possui os mesmos requisitos do sistema operacional. A Figura 13 apresenta um esquema do cenário de implantação adotado. Rede da Empresa TCP 5723 Clientes Figura 13 - Cenário de Implantação. 56 Para possibilitar a comunicação entre o Management Server e o agente, faz-se necessário liberar a porta 5723 nos firewalls entre eles. Sendo assim será obedecida a seguinte ordem de instalação dos componentes: a. Criação do servidor virtual no srv-bnu501; b. Instalação e configuração do sistema operacional no vsrv-bnu203; c. Criação da Base de dados operacional no srv-bnu301; d. Managemant Server no vsrv-bnu203; e. Instalação da Webconsole. f. Criação de uma segunda instancia do SQL no srv-bnu301. g. Criação da Base de dados de relatórios no srv-bnu301; h. Instalação do Reporting Server no srv-bnu301; i. Instalação das consoles operacionais nas estações; j. Instalação dos Agentes nos servidores internos; k. Instalação e Configuração da Autoridade Certificadora (CA) no vsrv-bnu203; l. Publicação e liberação de portas no firewall; m. Solicitação da liberação da porta 5723 nos firewalls dos clientes para os servidores a serem monitorados; n. Instalação manual e importação dos certificados nos servidores dos clientes; o. Importação das Management packs; Após a execução da instalação o ambiente de TI da empresa prestadora de serviços contará com mais um servidor o vsrv-bnu203 que possui as funções: VSRV-BNU203: Root Management Server; Autoridade Certificadora; Microsoft Internet Information Services (IIS); Windows Server 2003 Standard Edition R2: sistema operacional. Com a adição do vsrv-bnu203 e o balanceamento das máquinas virtuais nos servidores, a vsrv-bnu202 será movida para outro servidor, a empresa passa então a dispor de quatro servidores virtuais, conforme Tabela 12. 57 Tabela 12 - Servidores Virtuais. Nome VSRV-BNU102 VSRV-BNU202 VSRV-BNU201 VSRV-BNU203 Memória Reservada 1 GB 512 MB 2 GB 2 GB Virtualizado no servidor SRV-BNU501 SRV-BNU502 SRV-BNU502 SRV-BNU501 4.4 PROCEDIMENTOS DE INSTALAÇÃO Os procedimentos de instalação foram realizado com base no Deployment Guide, cuja sequência de instalação foi apresentada no item anterior (4.2). Junto com as instalações do Operations Manager está disponível uma ferramenta muito útil que verifica se o servidor atende os requisistos mínimos para instalar os componentes desejados. Essa ferrameta foi executada no servidor de banco de dados, o SRVBNU301, selecionando os componetes a serem instalados e feito a verificação. Após ao atentimento de todos os requisitos a tela da ferramenta está apresentada na Figura 14. Utilizando o Microsoft Virtual Server foi criado um servidor virtual com o Windows Server 2003 que hospedará o RMS e a webconsole. Conforme apresenta a Figura 15, todos os requisitos foram atendidos pelo novo servidor virtual vsrv-bnu203. 58 Figura 14 - Verificador de Pré-requisitos no SRV-BNU301 O próximo passo foi a criação das contas de usuários para serem usadas na execução dos serviços do Operations Manager. O Operations Manager depende de algumas permissões para realizar certas tarefas, por exemplo, instalar agentes remotamente. Para fornecer sempre o menor nível de acesso necessário para cada serviço foram criadas contas com permissões diferentes e um grupo para conceder permissão de administrador do Operations Manager. 59 Figura 15 - Verificador de Pré-requisitos no VSRV-BNU203 Seguindo os procedimentos sugeridos na documenteção do Operation Manager, foi instalado a OperationsManager database no servidor de banco de dados, o SRV-BNU301. Nesse momento foi necessário informar o Nome do Management Group, o tamanho da base de dados e o administrador do Operations Manager, que neste caso é o grupo criado anteriormente. Em seguida, no servidor virtual VSRV- BNU203, foi instalado o Managemet Server e a webconsole. O Managemet Server, por ser o primeiro, torna-se o root management server. Nesse momento é necessário informar o banco de dados, a instância onde está a base OperationsManager, a porta do SQL e, por fim, definir quais contas serão usadas para rodar cada serviço. 60 Para instalar o Data Warehouse database e o Report Server do Operations Manager foi necessário instalar e configurar outra instância do SQL, pois a instância padrão já estava sendo usada, apresentando erro ao tentar instalar. Após a criação e configuração da nova instância, foi instalado a Data Warehouse, que segue a mesma linha da instalação da OperationsManager database: é necessário informar a instância do SQL, o tamanho da base, os usuários que rodaram o serviço e, o Root Management Server. Em seguida, foram instalados os agentes nos servidores internos, através da ferramenta assitente de descoberta de computadores e dispositivos. Esta ferramenta faz uma busca no serviço de diretório, o Active Directory, e localiza os servidores, instalando automaticamente o agente, sem a necessidade de conectar em cada um deles e executar um procedimento. Este procedimento não é possível de ser realizado nos servidores dos clientes, devido a falta de confiança entre os domínios, sendo necessário utilizar certificados para a autenticação mutua e a instalação manual. Para instalar os agentes em cada cliente, foi publicado o servidor do Operations Manager na internet, usando a porta TCP 5723. Além disso, foi necessário instalar e configurar um serviço de autoridade certificadora (CA) (Figura 16), e assim, possibilitar a autenticação mutua requerida pela comunicação entre os componentes do Operations Manager. O procedimento para instalar o agente no servidor do cliente pode ser explicado sucintamente, da seguinte forma: executar a instalação; informar o management group, o servidor MS e a porta; importar o certificado da CA; requerer um certificado de autenticação; instalar o certificado depois de ser aprovado pelo administrador da CA; exportar a chave de criptografica; e por fim, importar esta mesma chave ao agente do Operations Manager. 61 Figura 16 - Autoridade Certificadora (CA). A instalação dos agentes pode ser intercalada à importação e configuração dos pacotes de gerenciamento (Managements Packs) dos serviços que irão ser monitorados. Cada management pack requer uma configuração adcional ou a execução de um procedimento para funcionar corretamente, além de personalização para monitorar o ambiente. Finalizando esta etapa, após a instalação do Operations Manager, algumas revisões foram realizadas, como: Checar os Logs de Eventos do Controlador de Domínio e do Servidor RMS e; Verificar a saúde dos computadores descobertos. 4.5 FUNCIONAMENTO A análise do funcionamento do sistema Operations Manager será feita através da ferramenta Operations Console, que é a ferramenta central de gerenciamento do Operations Manager, com uma interface que fornece acesso as áreas de monitoramento, criação, relatórios, espaço de trabalho e a administração (Figura 17). 62 Figura 17 - Console Operacional na aba de Administração 4.5.1 Monitoramento A aba de monitoramento na Operations Console permite que o operador possa explorar os dados coletados e resolver falhas encontradas, na forma de alertas, utilizando a própria console. A aba mostra os resultados do monitoramento, através de diferentes pastas e visões. A estrutura das pastas é definida por cada Management Pack que está importada no Operations Manager. A Figura 18 mostra a aba de monitoramento. 63 Figura 18 - Console Operacional na aba de Monitoração A visão mais utilizada é a visão dos Alertas Ativos (Figura 19). No caso da empresa, foi personalizada para mostrar primeiro os alertas mais recentes. Ao selecionar o alerta no Operations Manager é exibido os detalhes do alerta, que contém uma descrição do Alerta, possíveis causas e possíveis soluções para o evento que causou o alerta. Através da própria console pode ser executado ações remotas, para solucionar a falha, usando tarefas prédefinidas ou criadas pelos operadores. Por exemplo, iniciar ou reiniciar algum serviço que esteja parado, iniciar um ping para um servidor, mostrar a lista de processos rodando no servidor, etc. 64 Figura 19 - Visão de Alertas Ativos. A Figura 20 apresenta algumas das tarefas disponíveis na visão Computadores. A visão computadores fornece uma visão rápida da saúde de cada servidor de onde se pode abrir o ―Healt Explorer‖ que exibe a saúde de todas as funções do servidor e indica a causa raiz da falha, mostrado na Figura 21. 65 Figura 20 - Visão Computadores Figura 21 – Healt Explorer. 66 Na aba de monitoramento tem, ainda, as pastas com visões criadas pelas Managements Packs importadas, como por exemplo a pasta Microsoft Windows Server que faz um filtro dos alertas e contadores de desempenho relacionados com o Windows Server como o estado dos discos lógicos, interface de rede e gráficos de desempenho pré definidos conforme mostra a Figura 22. Figura 22 - Gráfico com os dados coletados 4.5.2 Criação A aba de criação na Operations Console (Figura 23) permite o usuário criar novos Objetos de monitoramento como, por exemplo, monitores, regras, aplicações distribuídas e grupos dentro do Operations Manager. A aba pode ser utilizada para fazer mudanças nas configurações de objetos que foram criados ou sobrescrever configurações dos Managements Packs Importados. 67 Figura 23 - Console Operacional na aba de Criação 4.5.3 Relatórios A aba de Relatórios (Figura 24) possibilita a geração de diversos de relatórios que podem ser criados ou gerar os pré-definidos pelo Management Packs. Como exemplo desses relatórios tem-se o histórico do uso do processador no servidor. Os relatórios demonstraram ser importantes instrumentos para determinar a forma com que os sistemas monitorados estão funcionando, a disponibilidade dos serviços e constatar a eficiência das organizações. Assim como prever a necessidade de atualização dos equipamentos (ex. processadores, dispositivos de armazenamento, etc). 68 Figura 24 - Console Operacional na aba de Relatórios 4.5.4 Administração A aba de administração (Figura 25) permitiu fazer mudanças nas configurações de todo o Management Group. Isso inclui agentes, notificações, permissões, tempo de armazenamento, etc. Permitiu ainda gerenciar a autorização ou a não autorização de servidores monitorados. 69 Figura 25 - Configurações na Aba de Administração O monitoramento dos servidores pode ser realizado, ainda, através da Webconsole (Figura 26), uma ferramenta on-line que permite o monitoramento fora da empresa de consultoria ou em estações onde não há Operation Console instalada, o que facilitou o trabalho da empresa prestadora de serviço. 70 Figura 26 - Webconsole. 4.6 ANÁLISE DO MONITORAMENTO Neste capítulo serão apresentados os principais resultados referentes ao monitoramento realizado no mês de maio 2008. Anteriormente à implantação do Operations Manager, o tempo de detecção e resposta de uma falha era consideravelmente elevado. Exigia que o cliente detectasse o erro e comunicasse à empresa prestadora de serviços e, somente então, ações corretivas podiam ser tomadas. Este procedimento ocasionava, por muitas vezes, a indisponibilidade de serviços por um longo período de tempo, o que prejudicava a qualidade dos serviços prestados pela empresa e ainda a eficiência dos serviços/operações realizadas pelos clientes. A implantação desse sistema de monitoramento possibilitou uma rápida detecção das falhas, assim como suas prováveis causas. Desta forma, os procedimentos para solucionar o 71 problema iniciam ainda antes que o cliente perceba o problema. O que diminuiu consideravelmente o tempo em que os serviços ficavam indisponíveis. O Operations Manager torna o diagnóstico da falha mais simples e rápido. Ele apresenta sugestões de causas e de soluções, disponíveis nas bases de conhecimentos de cada alerta, possibilita a visualização de gráficos de contadores de horas antes de ocorrer e executa tarefas nos servidores monitorados a partir da própria console de operações. Através de relatórios de desempenho, foi possível projetar o tempo que um hardware do servidor levaria para perder a eficiência, apontando os componentes do servidor que realmente precisariam ser feito atualizações ou quando o servidor precisaria ser aposentado. Sendo assim, o Operations Manager mostrou ser uma ferramenta com inúmeras possibilidades para proporcionar uma série de melhorias nos serviços de monitoramento. Por se tratar de um sistema complexo, parte de seu potencial não foi explorado neste trabalho, como por exemplo, a implantação da auditoria dos eventos de segurança e o monitoramento de estações de trabalho. O Operations Manager foi extremamente eficaz ao alertar a indisponibilidade dos serviços monitorados. Contudo, se demonstrou bastante trabalhoso ao definir as configurações da linha de base dos seus servidores monitorados, exigindo muitas personalizações nas regras de monitoramento. O serviço que mais exigiu personalizações foi o monitoramento dos servidores de E-mails com Exchange. Um fator que dificultou o procedimento de configuração foi a existência de cenários bastante distintos/extremos, por exemplo: clientes com menos de 20 caixas de correios e cliente com mais de 3 mil caixas, sites corporativos que recebem 10 visitas por dia e outros que recebem até 10 mil visitas por dia. Exigindo configurações diferentes dos mesmos serviços para cada cliente. Os principais alertas gerados pelo monitoramento durante o mês de maio foram devido a problemas de desempenho, sendo que, entre os cinco alertas gerados mais freqüentes, três foram causados por desempenho dos servidores, conforme a Figura 27 e a Tabela 13, retirado do Apêndice A. 72 Figura 27 - Alertas mais comuns Tabela 13 - Alertas mais comuns 1º 2º 3º 4º 5º Nome do Alerta Ocorrências Health Service Heartbeat Failure 881 Script or Executable Failed to run 405 Microsoft Windows Internet Information Services 2003 249 Application Pool is Unavailable. Percentage of Committed Memory in Use is too high 237 LDAP Search Time - sustained for 5 minutes 210 Red(>100msec). % 23,97% 11,02% 6,77% 6,45% 5,71% O alerta mais comum (23,97%) corresponde a indisponibilidade no monitoramento (Health Service Heartbeat Failure), que apresentaram três causas distintas: quedas no link de internet do cliente, quedas de energia do cliente e falhas no agente de monitoramento. Em segundo lugar, têm-se falhas nos scripts de monitoramento (11,02%), que na maioria dos casos foram causados por Timeout, devido ao uso excessivo dos recursos do servidor, como por exemplo, uso do processamento. A indisponibilidade do serviço de Web foi a terceira falha mais ocorrida (6,77%), causada, na maioria dos casos, por paradas planejadas pelos clientes para efetuar backups não comunicadas para o serviço de monitoramento. O alto uso da memória disponível nos servidores correspondeu a 6,45% dos alertas gerados, sendo que, para esse alerta ser gerado, o uso precisa permanecer acima de 80% da memória disponível. Em alguns clientes, essa linha de base foi aumentada para 90%, como pode ser confirmado através da Figura 28 e da Tabela 14, que apresenta o uso da memória. 73 Figura 28 - Uso da memória disponível. Tabela 14 - Uso da memória disponível Servidores 1º mail do cliente 14 Amostras Valor Valor Valor Mínimo Máximo Médio 1476 67,03% 99,46% 88,11% 2º server01 do cliente 01 1638 74,68% 92,31% 85,77% 3º srv-bnu301 da empresa 1496 46,31% 84,25% 78,35% 4º srv101 do cliente 02 1475 56,8% 91,44% 77,83% 5º srv-bnu101 da empresa 440 63,88% 84,33% 73,36% 6º srv05 do cliente 11 1656 8,88% 74,96% 65,27% 7º srv301 do cliente 02 1535 55,92% 74,06% 64,12% 8º dados do cliente 14 1624 20,47% 90,33% 62,19% 9º srv-bnu501 da empresa 1396 60,33% 64,3% 60,72% 1497 26,96% 77,25% 58,5% 10º vsrv-bnu201 da empresa Os relatórios de desempenho foram usados como guias, onde foi possível implantar novas funções nos servidores, comprovar falhas em aplicativos e atualizações de servidores. Neste sentido, utilizando o sistema de monitoramento Operations Manager, foi possível diminuir o tempo em que os serviços ficavam indisponíveis, prevenir paradas por motivos fúteis, como a falta de espaço em disco e, ainda, detectar erros nos aplicativos que provê o serviço, onde simples ações podem evitar falhas futuras. 74 5 CONCLUSÕES O System Center Operations Manager é uma ferramenta para o gerenciamento de serviços que permite centralizar o monitoramento de diversos hardwares, produtos de softwares e serviços de rede. Com ele é possível fazer o monitoramento de capacidades de sistemas e computadores, desde o desempenho e eventos até o comportamento de cada dispositivo, considerando um gerenciamento total, de ponta a ponta (chamado end-to-end). Da análise da infra-estrutura da empresa prestadora de serviços foi estabelecido o cenário de implantação do Operations Manager que mais se adequou à empresa, objetivo alcançado a medida que todos os serviços previstos para serem monitorados foram contemplados na implantação. Para atender os objetivos foi necessário instalar componentes básicos - Management Group, formado pela OperationsManager Database, pelo Root Management Server, pela Operations Console e por um ou mais agentes instalados em servidores monitorados ou equipamentos de rede e componentes opcionais - para a criação de relatórios mensais, a Data Warehouse database e o Report Server; a Webconsole como uma alternativa ao uso da Operations Console e para utilização externa; e o Command Shell, para automatização de tarefas. A etapa de implantação do Operations Manager foi realizada com êxito, entretanto, este processo foi o mais trabalhoso, isto porque envolveu diferentes configurações devido aos cenários distintos apresentados para cada cliente. Conclui-se então, que o Operations Manager é uma ferramenta eficiente para executar tarefa de monitoramento, pois ele possibilita reduzir o tempo de indisponibilidade de serviços, prevenir paradas nos serviços e servidores de rede e detectar erros nos aplicativos. Desta forma, por resultar na otimização de serviços e procedimentos, a implantação do Operations Manager pode significar redução de custos para os clientes, montantes estes que podem ser investidos em novas tecnologias e serviços. 75 5.1 SUGESTÕES PARA CONTINUAÇÃO DO TRABALHO A fim de complementar este trabalho, recomenda-se que para trabalhos futuros, sejam realizados os seguintes estudos: A implantação de auditoria dos eventos de segurança e o monitoramento de estações de trabalho. Expandir o monitoramento para dispositivos de rede como roteadores e switches. Monitorar serviços rodando em outras plataformas que não sejam da Microsoft. A implantação de outros produtos da Família System Center como, por exemplo: do System Center Configuration Manager. 76 6 CRONOGRAMA A Tabela 1 abaixo apresenta o cronograma de atividades que foi seguido durante a elaboração deste projeto no primeiro semestre de 2008. Tabela 15 - Cronograma de Atividades. ETAPA DO TRABALHO REVISÃO BIBLIOGRÁFICA ESTRATÉGIA DE PESQUISA SUB-ETAPAS / ATIVIDADES Gerenciamento de Serviços de TI Information Technology Infrastructure Library Microsoft Operations Framework - MOF System Center Operations Manager Definição do problema de pesquisa e objetivos Elaboração da Metodologia PERÍODO DE REALIZAÇÃO Março / Junho Março / Abril Análise da Infra-estrutura. Serviços de Monitorados. RESULTADOS E DISCUSSÃO Cenário de Implantação Abril Instalação Funcionamento Maio / Junho Análise do Monitoramento Considerações Finais CONCLUSÕES Recomendações para trabalhos futuros Junho 77 7 REFERÊNCIAS ACADEMIA DE GERENCIAMENTO MICROSOFT 2007. <http://www.microsoft.com/brasil/academia> Acesso em 20 mai. 2008. Disponível em: FOX, Chris; DOWNING, John; SIMMONS, Kim. Operations Manager 2007 Operations Guide. Microsoft Corporation, 2007. 105 p. FOX, Cristopher. Operations Manager 2007 Deployment Guide. Microsoft Corporation, 2007. 41 p. FOX, Cristopher. Operations Manager 2007 Design Guide. Microsoft Corporation, 2007. 41 p. KUROSE, James F; ROSS, Keith W. Redes de computadores e a Internet: uma abordagem topdown. 3. ed. São Paulo : Pearson Addison Wesley, 2005. 634 p. MARQUES, Cleber. Microsoft Operations Framework <http://www.clebermarques.com> Acesso em 21 mai. 2008. 4.0. Disponível em: MARQUES, Cleber. SCOM 2007. Disponível em: <http://www.clebermarques.com> Acesso em 21 mai. 2008. MICROSOFT OPERATIONS FRAMEWORK (MOF). <http://www.microsoft.com/brasil/mof> Acesso em 13 mar. 2008. Disponível em: MICROSOFT. Active Directory Management Pack Guide. Microsoft Corporation, 2008. 37 p. MICROSOFT. Exchange Server 2003 Management Pack Guide. Microsoft Corporation, 2008. 75 p. MICROSOFT. Exchange Server 2007 Management Pack Guide. Microsoft Corporation, 2008. 28 p. MICROSOFT. SQL Server Management Pack Guide. Microsoft Corporation, 2008. 27 p. MICROSOFT. Windows DNS Server Management Pack Guide. Microsoft Corporation, 2008. 19 p. MICROSOFT. Windows Dynamic Host Configuration Protocol Management Pack Guide. Microsoft Corporation, 2008. 28 p. MICROSOFT. Windows Server Internet Information Services Management Pack Guide. Microsoft Corporation, 2008. 28 p. NASCIMENTO, E.S do. Apostila de metodologia científica do curso de Enfermagem em Terapia Intensiva Adulto. Instituto de Educação Continuada (IEC) da Pontifícia Universidade Católica (PUC) de Minas Gerais. Belo Horizonte, 2003. 111 p. OLIVEIRA, S. L. de. Tratado de metodologia científica: projetos de pesquisas, TGI, TCC, monografias, dissertações e teses. 2. ed. São Paulo: Pioneira Thomson. 1999. 315 p. PRINCE, Brad; MUELLER, John P.; FENSTERMACHER, Scott. Mastering System Center Operations Manager 2007. Indianapolis: Wiley, 2007. 431 p.