GERENCIAMENTO DE DISPONIBILIDADE DE INFRAESTRUTURA - BASEADO NAS MELHORES PRÁTICAS DE ITIL Wagner Jean da Silva Papi [email protected] Roberto Petry [email protected] – Orientador Universidade Luterana do Brasil (Ulbra) – Curso de Tecnologia em Redes de Computadores – Campus Canoas Av. Farroupilha, nº 8001 · Bairro São José · Cep 92425-900 – Canoas - RS 15 de junho de 2011 RESUMO Visando otimizar a capacidade da infraestrutura de TI da organização, fornecer um nível sustentado de disponibilidade a um custo aceitável e garantir que os serviços fornecidos pela TI estarão à disposição dos clientes e usuários no quando solicitados deve-se prover o gerenciamento efetivo da disponibilidade dos recursos tecnológicos e serviços oferecidos pela área de TI. O projeto visa, através das melhores práticas de ITIL V3, fornecer um diagnóstico do processo de Gerenciamento de Disponibilidade da Empresa WTI. Palavras-chave: ITIL V3, Gerenciamento de Disponibilidade ABSTRACT Title: “Availability Management of infrastructure- Based on best practices ITIL” In order to optimize the capacity of the organization's IT infrastructure, provide a sustained evel of availability at an acceptable cost and ensure that services provided by IT will be available to customers and users in when it should be requested to provide effective management of available resources technology and services offered by IT. The project aims, through the best practices of ITIL V3, provide a diagnostic process Availability Management Company XXX Key-words: ITIL V3, Availability Management 1 INTRODUÇÃO A área de TI é igualmente influenciada pelo contexto onde atua a organização, visto que está inserida atualmente em quase todos os processos do negócio. Assim faz-se necessária a adoção de uma abordagem que maximize a eficiência e a efetividade do valor criado pela área de TI para a organização, fazendo com que exista um real aumento da produtividade. Para ser capaz de fornecer os serviços de TI de acordo com a funcionalidade, níveis de serviço e custo acordados, a forma de trabalho orientada a processos é a melhor forma de estruturação da área de TI. (MAGALHÃES E PINHEIRO, 2007) Segundo Fernandes e Abreu (2008), a ITIL é um conjunto de melhores práticas quem vem ao encontro do novo estilo de vida imposto às áreas de Tecnologia da Informação, habilitando o incremento da maturidade do processo de gerenciamento de TI, essas melhores práticas, fornecem uma alternativa para o Gerenciamento de Serviços de TI, pela utilização de uma metodologia de gerenciamento focada nos processos e nas suas relações de dependência. A ITIL não define os processos a serem implementados na área de TI, mas sim, demonstra as melhores práticas que pode ser utilizadas, que podem ser adotadas do modo que melhor puder atender às necessidades de cada organização. (FERNANDES E ABREU,2008) 1 Dentre os processos da ITIL como modelo de referência, encontra-se o Gerenciamento de Disponibilidade que visa determinar os níveis de disponibilidade dos diversos serviços de TI. O processo de Gerenciamento de Disponibilidade tem por objetivo otimizar a capacidade da infraestrutura de TI e ajudar esta área a entregar um nível sustentado de disponibilidade a um custo aceitável que permita satisfazer os objetivos do negócio, propiciando à organização a plena utilização dos recursos da infraestrutura de TI (MAGALHÃES e PINHEIRO, 2007). O presente trabalho, tem como objetivo fornecer um diagnóstico do processo de Gerenciamento de Disponibilidade da Empresa WTI, baseado nas melhores práticas de ITIL, de forma a ser utilizado como base para um programa de melhoria contínua do processo que direcione a organização a um padrão de qualidade mais elevado na provisão dos seus serviços, além de base para futuras comparações em diagnósticos de maturidade. 1.1 Motivação Muitas organizações de TI não possuem um processo específico para o Gerenciamento de Disponibilidade e não devem esperar a elevação do nível de disponibilidade apenas com a introdução de novas ferramentas e/ou tecnologias. O processo de Gerenciamento de Disponibilidade assegura que os sistemas, as redes, as aplicações, as estações de trabalho e os serviços estejam disponíveis ao usuário quando necessitados. Nesse contexto, o presente estudo de caso visa examinar a maturidade e a qualidade do processo de Gerenciamento de Disponibilidade da Empresa WTI, baseado nas melhores práticas recomendadas na ITIL V3. 1.2 Objetivo Geral Fornecer um diagnóstico do processo de Gerenciamento de Disponibilidade da Empresa WTI, conforme as práticas recomendadas pelo ITIL e adaptando-as para o contexto da organização. 1.3 Objetivo Específico Os objetivos específicos a serem alcançados são: Fornecer uma lista de indicadores de desempenho; Fornecer uma lista de recomendações que podem contribuir para as melhorias do processo; 2 FUNDAMENTAÇÃO TEÓRICA A fundamentação teórica deste trabalho baseia-se em um estudo da ITIL e do seu processo de Gerenciamento de Disponibilidade. 2.1 ITIL O ITIL foi desenvolvido na década de 80 para o governo britânico pelo CCTA (Central Communications and Telecom Agency), que no ano de 2001 foi incorporado pelo OGC (Office of Government Commerce), para servir como modelo para gerenciamento dos níveis de qualidade dos prestadores de serviços de TI para seus diferentes órgãos, agências e instituições objetivando garantir uma padronização de atendimento em termos de processos, desempenho, qualidade e custos. Por ter sido concebido como um padrão aberto, o ITIL passou a ser adotado a partir da década de 1990 por organizações européias privadas, devido seu enfoque na qualidade, em função da definição de processos e a proposição das melhores práticas para o Gerenciamento dos Serviços de TI. Com o passar dos anos passou a ser utilizada por organizações públicas e privadas ao redor do mundo, tornando-se um modelo padrão visto que devido sua abrangência e praticidade pode ser utilizado por qualquer organização independente do tamanho de sua estrutura (MAGALHÃES e PINHEIRO, 2007; FERNANDES e ABREU,2008). 2 O ITIL (Information Technology Infrastructure Library) é um modelo de melhores práticas para o gerenciamento de serviços de tecnologia de informação. Tem como principal objetivo prover um conjunto de práticas de gerenciamento de TI organizadas a partir do ciclo de vida e melhoria dos serviços tanto para organizações que já possuem operações de TI e pretendem empreender melhorias quanto para organizações que desejam implantar novas operações. Conseqüentemente, leva a organização a um grau de maturidade e qualidade permitindo uma utilização mais eficiente e eficaz dos recursos e serviços da TI, focadas no alinhamento estratégico e integrada com as necessidades dos clientes e usuários (FERNANDES e ABREU, 2008). Conforme Albertin e Albertin (2005) o ITIL provê um conjunto de melhores práticas para o Gerenciamento dos Serviços proporcionando aos executivos de TI trabalhar em parceria com as áreas de negócio, objetivando a entrega de serviços de alta qualidade juntamente com a redução dos custos de TI e acompanhamento das mudanças exigidas pelas áreas de negócio utilizando como método, a realização de processos efetivos e identificação de serviços que agreguem valor ao negócio. O ITIL não é uma metodologia que se implanta em uma empresa ou organização e sim um modelo de práticas que mostram objetivos, entradas e saídas de processos e atividades que podem ser adotadas de acordo com a necessidade de cada organização (OGC, 2000a). 2.2 Gerenciamento de Disponibilidade O Gerenciamento de Disponibilidade é o processo que visa otimizar a capacidade da infraestrutura de TI ajudando a organização a entregar um nível sustentado de disponibilidade a um custo aceitável, garantindo que os serviços estarão a disposição dos clientes e usuários sempre que for preciso e permitindo assim que os objetivos do negócio sejam alcançados.Sofre influência de fatores como demandas do negócio e o custo necessário para satisfazer esta demanda, complexidade da infraestrutura de TI que dependerá da capacidade de atender os serviços oferecidos e dos níveis de disponibilidade desejados (itSMF, 2006;MAGALHÃES e PINHEIRO, 2007). Para a OGC (2007) o objetivo do Gerenciamento de Disponibilidade é garantir que o nível de disponibilidade de todos os serviços entregues sejam compatíveis ou superem os acordos de níveis de serviço necessários pela organização a um custo aceitável. Tem o propósito de controlar as questões referentes à disponibilidade tanto de serviços quanto os recursos de TI utilizados por estes serviços, assegurando que os objetivos de disponibilidade possam ser medidos e alcançados. Sturm, Morris e Jander (2000) definem disponibilidade como sendo o percentual de tempo que um serviço está disponível para utilização, mas salienta que esta definição pode gerar opiniões controversas se tratada como medida para qualidade, por ser resultante função exercida e da perspectiva individual que cada avaliador tem a respeito dos objetivos de determinado serviço e cita como exemplo que para um administrador de rede a disponibilidade de um serviço é a conectividade de uma rede de comunicação, enquanto que para um administrador de banco de dados é a disponibilidade de acesso a um dado armazenado no Banco de dados e para um administrador de sistemas o serviço estar operacional. Mas a avaliação individual da disponibilidade de componentes não condiz com a percepção do usuário final que entende por disponibilidade o fato de poder acessar as aplicações e dados necessários para executar suas atividades. A OGC (2000a) complementa a definição anterior afirmando que “a disponibilidade e confiabilidade da TI podem influenciar diretamente a satisfação do usuário e a reputação do negócio”. Por este motivo, o Gerenciamento de Disponibilidade é essencial para assegurar que a TI entregue os níveis de serviços requeridos pelo negócio satisfazendo seus objetivos e a qualidade de serviço exigida pelos seus usuários ou clientes. A disponibilidade deve ser definida, medida, monitorada e entregue de acordo com o requerido pelos processos do negócio e as necessidades dos usuários e clientes. O planejamento deve cobrir também detalhes como tempos de resposta, direitos de acesso, análise das possíveis paradas a que os sistemas podem estar sujeitos (DUGMORE e LACY, 2004). Para Magalhães e Pinheiro (2007), o objetivo do processo de Gerenciamento de Disponibilidade é propor alternativas ao negócio nos pontos onde houver um desequilíbrio entre os requisitos de disponibilidade e a capacidade de atendê-los. 3 2.3 Responsabilidades Segundo Magalhães e Pinheiro (2007), o processo de Gerenciamento de Disponibilidade assegura a disponibilidade de sistemas, redes, aplicações, estações de trabalho e serviços, quando requisitados por clientes e/ou usuários e tem por responsabilidades: 2.4 o Otimizar a disponibilidade, monitorando e informando sobre os elementos-chave da disponibilidade; o Determinar os requisitos de disponibilidade em termos de negócio; o Predizer e projetar de acordo com os níveis de serviços esperados de disponibilidade e segurança; o Elaborar o Plano de Disponibilidade; o Coletar, analisar e manter os dados de disponibilidade e elaborar relatórios sobre estes dados; o Garantir que os níveis de serviços sejam alcançados através da monitoração da disponibilidade dos Serviços de TI em relação aos SLAs, acordos de nível operacional e acordos realizados com fornecedores externos de produtos e serviços; o Influenciar o desenvolvimento de produtos e serviços para que estes estejam alinhados com as necessidades do negócio; o Manter cronograma de testes com relação a resiliência e queda de serviços e componentes; o Auxiliar na identificação e solução de incidentes e problemas associados com indisponibilidade de serviços ou componentes; o Rever e melhorar a disponibilidade dos serviços continuamente. Princípios e Conceitos Básicos Segundo a OGC (2000a) a “disponibilidade” da infraestrutura de TI que fornece os serviços para o negócio e seus usuários, é influenciada por fatores como a complexidade da infraestrutura de TI, a confiabilidade dos componentes, o ambiente desta estrutura, a capacidade da organização de manter e sustentar a infraestrutura de TI e os níveis e qualidade de serviços de fornecedores. Para Dugmore e Lacy (2004) o processo de Gerenciamento da Disponibilidade geralmente é realizado de maneira transparente para os usuários e envolve a forma como os serviços são agregados, entregues e suportados, preocupando-se com a eficiência e eficácia do provedor do serviço em questão e seus fornecedores. A seguir são listados alguns elementos do Gerenciamento de Disponibilidade: o Disponibilidade: a probabilidade de um serviço de TI estar disponível em um dado momento ou durante determinado período de tempo. É indicador chave para a qualidade de serviço que é percebida pelo usuário ou requerida pelo negócio. Depende de fatores como disponibilidade de componentes, resiliência de falhas e qualidade do suporte e manutenção da área de TI (OGC, 2000a; MAGALHÃES e PINHEIRO, 2007); o Confiabilidade: a habilidade de manter serviços e componentes em operação e livres de falhas. É determinada pela confiança nos componentes da infraestrutura de TI e serviços entregues e os níveis de manutenção preventiva para prevenir a ocorrência de falhas (OGC, 2000a; itSMF, 2006); o Sustentabilidade: a capacidade de restaurar a operação normal de serviços ou componentes (DUGMORE e LACY, 2004) e conforme a OGC (2000a) pode ser dividida nos estágios de antecipação, detecção, diagnóstico, solução e recuperação de falhas e, por fim a restauração dos serviços de TI; 4 o Capacidade de serviço: os suportes com fornecedores terceirizados que podem ser contratados para realização de serviços em determinadas áreas da infraestrutura de TI (DUGMORE e LACY, 2004; itSMF, 2006); o Segurança: implementação de controles que visa garantir a continuidade do serviço de TI dentro de parâmetros como confidencialidade, integridade e disponibilidade (itSMF, 2006); o Usuário: o termo é utilizado para definir o consumidor de determinado serviço, sendo considerado, portanto, tanto o usuário interno da organização quanto o externo na figura do cliente (OGC, 2000a). O Gerenciamento de Disponibilidade é um processo contínuo, que procura assegurar que os serviços de TI alcancem os objetivos de disponibilidade acordados e que novas demandas a serem desenvolvidas procurem atender os objetivos previamente definidos sem ocasionar risco ao desempenho dos serviços existentes. No intuito de atender estes objetivos, o Gerenciamento de Disponibilidade deve executar atividades reativas e proativas conforme Figura 1. As atividades reativas a serem executadas consistem em monitorar, medir, analisar, reportar e revisar todos os aspectos relacionados com a disponibilidade de serviços e componentes. Durantes estas atividades, que visam assegurar que os objetivos de serviços acordados sejam medidos e alcançados, podem ser detectadas anomalias ou variações nestas medidas, que deverão ser investigadas e executadas ações corretivas. Já as atividades proativas consistem na produção de recomendações, planos e documentos que servirão de guia tanto para novos como para serviços modificados, melhoria continua dos serviços da TI e redução de riscos que possam representar custos (OGC, 2007). Figura 1– Processo de Gerenciamento de Disponibilidade Fonte: OGC (2007a) 5 2.5 Métricas de Disponibilidade Para a OGC (2000a) as medições de disponibilidade devem ser significativas e agregar valor caso estas medidas sejam fundamentais para a geração de benefícios para a TI e ao negócio da organização. Será influenciado pela combinação de o que se está medindo e como será informado. O Modelo de Métricas de Disponibilidade (MMDTI), “permite avaliar a escala de métricas e perspectivas que devem ser consideradas quando do estabelecimento da medição e de relatórios de disponibilidade”(MAGALHÃES e PINHEIRO, 2007). A Figura 2 apresenta o modelo de métricas de disponibilidade. A disponibilidade é percebida pelos usuários dos serviços de TI em função de três fatores básicos que devem ser considerados na medição da disponibilidade dos serviços: o A quantidade de indisponibilidade (freqüência); o A duração de cada indisponibilidade (duração); o A quantidade de usuários afetados por uma indisponibilidade (escopo). Figura 2– Modelo de Métricas de Disponibilidade Fonte: itSMf (2006) 2.6 Plano de Disponibilidade Conforme a itSMF (2006) o Plano de Disponibilidade “deve ser um plano proativo de melhoria em longo prazo da disponibilidade de TI, dentro das limitações de custos impostas”. Deve ter metas e objetivos, além de considerar questões relacionadas a pessoas, processos, ferramentas, técnicas e foco na tecnologia. O plano traduz-se em um cronograma indicando os períodos em que os serviços estarão disponíveis ou não conforme o modelo na Figura 3 (MAGALHÃES e PINHEIRO, 2007). 6 Figura 3 – Plano de Disponibilidade Fonte: itSMf (2006) 2.7 Melhoria Contínua da Disponibilidade O Gerenciamento de Disponibilidade executa importante papel na otimização da infraestrutura de TI existente, procurando oferecer níveis de disponibilidade melhorados a custos menores quando existe necessidade de mudança nos requerimentos de disponibilidade (OGC,2000a). A Figura 4 apresenta um exemplo de processo de melhoria contínua da disponibilidade composto por quatro fases. Figura 4 – Melhoria Contínua da Disponibilidade Fonte: itSMf (2006) 7 2.7.1 Fase 1 – Avaliar e Planejar Nesta fase procura-se descobrir as necessidades reais de disponibilidade requeridas pelo negócio e o que deve ser feito para alcançar estes objetivos. Para isto, deve-se avaliar a capacidade atual de atingir e sustentar os requisitos de disponibilidade e definir planos e estratégias para alcançar estes níveis. É necessário definir os objetivos de negócio e seus principais processos de suporte a estes objetivos para em seguida quantificar o valor de negócio oferecido por estes processos e os custos de oferecimento. 2.7.2 Fase 2 – Desenhar e Implementar Na segunda fase são estabelecidos níveis mensuráveis de objetivos dos serviços de TI, definida uma Arquitetura Corporativa, processos de gerenciamento de TI e estruturas de suporte. Nesta etapa, deve-se selecionar e implementar a tecnologia, processos e ferramentas que darão suporte aos processos de negócio e designar pessoas e implementar as estruturas de suporte. 2.7.3 Fase 3 – Operar e Monitorar Nesta fase serão definidas as tarefas operacionais a serem executadas para atingir e sustentar os níveis de serviço necessários. Junto à operação, serão monitoradas a eficiência e eficácia dos processos relacionados à disponibilidade, dos níveis de serviços acordados e realizados as correções necessárias juntamente com um planejamento de manutenção proativa (hardware e software). 2.7.4 Fase 4 – Analisar e Aprimorar Nesta última fase são definidas as ações a serem executadas para o aprimoramento dos atuais resultados, necessitando para isto: determinar causas de deficiências, ações para reduzir estas causas e os custos destas ações e desenvolver ações de aprimoramento e monitorar seus resultados. 2.8 Indicadores de desempenho Segundo Magalhães e Pinheiro (2007), o processo de Gerenciamento de Disponibilidade precisa prover pontos de controle que permitam a avaliação de sua eficiência, eficácia, efetividade e economicidade, conhecidos como Indicadores de Desempenho. O Quadro 1 apresenta uma proposta de Indicadores de Desempenho para administração dos processos de Gerenciamento de Disponibilidade, modelados a partir da metodologia SAS®. Quadro1 – Proposta de Indicadores de Desempenho Perspectiva Indicador Eficiência Índice de variação do tempo de restabelecimento dos serviços Índice de variação do tempo médio entre falhas Eficácia Índice de disponibilidade dos serviços de TI Índices de serviços de TI cuja disponibilidade cumpre o ANS Índice de serviços essenciais com mecanismo de alta disponibilidade Efetividade Índice de problema devido à indisponibilidade Índice de satisfação dos usuários com os serviços de TI. Economicidade Índice da receita garantida por mecanismos de alta disponibilidade Índice de investimento em disponibilidade 8 3 METODOLOGIA O presente estudo de caso foi elaborado com base em bibliografias de ITIL V3, entrevistas, reuniões com os profissionais da área de TI onde foram analisados e avaliados os principais processos do Gerenciamento de Disponibilidade. Após avaliação, serão gerados relatórios que apontam pontos fortes e fracos do processo dentro da organização TI da Empresa WTI O diagnóstico do processo de Gerenciamento de Disponibilidade irá fornecer uma lista de recomendações que podem contribuir para as melhorias do processo e uma lista de indicadores de desempenho que auxiliam na busca, no controle e na evolução do processo. Além disso, cada recomendação será seguida de uma prioridade e prazo para implantação. Prioridade o Alta – essencial para a operação do processo; o Média – necessária para uma operação eficiente do processo; o Baixa – desejável. Prazo de implantação o Imediato; Curto – inferior a três meses; o Médio – de três a seis meses; o Longo – superior a seis meses 4 ESTUDO DE CASO - EMPRESA WTI1 4.1 Caracterização da empresa e seu ambiente A Empresa WTI está no mercado de serviços de tecnologia em TI há 10 anos, com a missão de desenvolver e fornecer soluções qualificadas e diferenciadas em TI, proporcionando maior produtividade, agilidade, mobilidade e economia as empresas, através de uma equipe competente de colaboradores e fornecedores. A Empresa WTI objetiva antecipar cenários e oferecer o que existe de mais atualizado em tecnologia, a fim de aplicar a melhor infraestrutura de hardware, software. O serviço parte de um diagnóstico quantitativo e qualitativo observando as demandas, expectativas e particularidades de cada cliente para que a melhor solução seja oferecida. É uma empresa de pequeno porte e conta com 15 funcionários distribuídos conforme organograma abaixo: Diretor RH/Financeiro Auxiliar Financeiro Comercial (2 funcionários) TI Desenvolvimento (4 funcionários) Infraestrutura (5 funcionários) 1 A empresa referenciada nesse artigo não autorizou a divulgação de seu nome, WTI nome fictício. 9 Sua infraestrutura é composta por: Servidores- 1 Web/E-mail,1 de arquivos e 1 Desenvolvimento; 1 Firewall; 1 Roteador; 1 Switch; Links- 1 de internet (10Mbps) e 1 MPLS (512 Kbps) para ligação do escritório; Terminais Desktop- 15 Desktops 3 Impressora Banco de Dados Oracle Sistema ERP 4.2 Coleta de dados –Entrevista O Quadro 2, apresenta o questionário aplicado na entrevista realizada com o Diretor e Equipe de TI da Empresa WTI. Variáveis Fonte Quadro 2 – Questionário Entrevista Questões Conhecimento OGC (2000ª) Qual o seu conceito de disponibilidade? itSMF (2006) Qual índice de disponibilidade dos recursos e serviços de TI? itSMF (2006) Como é medida a disponibilidade na sua empresa? Fernandes e Como é definido o índice de disponibilidade dos serviços? Abreu (2008) OGC (2007) Como é realizado o monitoramento dos indicadores de disponibilidade? itSMF(2006) Os serviços terceirizados são monitorados com relação à disponibilidade? Como? OGC (2007) Como é avaliada a confiabilidade e tempo médio entre incidentes nos serviços ou falhas em componentes? Monitoramento e medidas 10 OGC (2007) Os riscos de indisponibilidade são calculados? Como? OGC (2007) Como é realizado o balanceamento entre a disponibilidade exigida e custo requerido? Vulnerabilidades OGC (2007) Quais as principais vulnerabilidades na infraestrutura que podem comprometer a disponibilidade? Riscos Impacto nos negócios Fernandes e Qual o planejamento para minimizar os impactos no momento de Abreu (2008) falha de serviços ou recursos? 4.3 Análise da Entrevista As entrevistas foram realizadas com o Diretor da empresa e 4 profissionais da área de TI. As questões iniciais relacionadas com o Gerenciamento de Disponibilidade procuram confrontar o entendimento dos entrevistados sobre “Disponibilidade” e a percepção deles a respeito do pensamento que os usuários dos serviços da TI possuem sobre o mesmo assunto. Para isto foi solicitado primeiramente a cada um dos entrevistados que expusesse seu conceito de disponibilidade. Para o Entrevistado A, disponibilidade “é ter o serviço com performance e funcionando no horário que o cliente o utiliza”. De maneira semelhante ao exposto pelo Entrevistado A, para o Entrevistado B disponibilidade é o serviço estar funcionando, liberado para uso e o cliente ser atendido. Na concepção do Entrevistado C, disponibilidade é “você ter acesso no momento que precisa a tudo que é oferecido, é ter à disposição o que foi contratado”. Em contrapartida, nem todos entendem que o serviço precisa estar funcionando com o melhor desempenho possível para ser considerado como disponível, conforme observado pelo Entrevistado C ao expressar que a disponibilidade está relacionada com “garantir que um serviço ou parte dele esteja suficientemente ativo para que o negócio tenha andamento. Não precisa tudo voltar ao normal no momento de uma pane, pode ser parcialmente desde que tenha sido acordado com a unidade de negócio”. As assertivas anteriores encontram respaldo nas respostas dos Entrevistados D e E, que definem disponibilidade como ter os recursos disponíveis para acesso, funcionando de maneira perfeita e, permitindo aos usuários exercerem suas atividades de forma adequada e sem transtornos. A questão seguinte procurou proporcionar um momento de reflexão e fazer com que os entrevistados se colocassem no lugar dos usuários da TI, e pudessem definir disponibilidade sob a ótica do cliente e não do prestador do serviço. Os Entrevistados A e B comentaram que para o usuário disponibilidade é poder utilizar de maneira rápida, fácil, sem nenhuma anormalidade durante a utilização e na hora que for preciso, enquanto que para o Entrevistado C, na visão do usuário comum todos os serviços têm que estar à disposição 24X7, independente se as camadas mais altas da organização acreditam que, ao analisar a questão custo/benefício, verifica-se que os serviços somente precisam estar à disposição 18X6. O Entrevistado reforça que “o que vai garantir a nossa disponibilidade é o contrato que vamos fazer em termos de SLA”. Em concordância ao exposto por C, o Entrevistado D afirma que para o cliente “é o serviço ou recurso estar 100% disponível, ou seja, quando a área de TI fornece 100% do serviço no ar, quando ele clica no mouse ele vai ter a resposta ou, quando solicita um relatório este será impresso. 11 As próximas questões referem-se ao monitoramento e medidas da disponibilidade de serviços e recursos. A primeira pergunta para esta variável foi a respeito do índice de disponibilidade dos recursos e serviços de TI Conforme exposto pelo Entrevistado D, a TI “tem alguns planos de disponibilidade, porém não são planos formais...”, com isto os índices de disponibilidade ficam reduzidos a alguns itens, que segundo os Entrevistados A, B e C, são os serviços de rede, e-mail e links de comunicação e possuem índice disponibilidade de 99%. O Entrevistado C faz menção que “todos os nossos recursos têm um percentual de disponibilidade bastante aceitável...”, opinião compartilhada pelo Entrevistado E ao afirmar que os índices do restante dos serviços e recursos da TI giram em torno de 95 à 99%. Dando continuidade à entrevista, foi perguntado aos entrevistados como é medida a disponibilidade na TI e nas unidades externas. Conforme explicado pelo Entrevistado A, existe um indicador de disponibilidade que se divide em duas partes: a primeira referente a serviços, onde cada parada é registrada e o tempo que o serviço ficou fora do ar é medido, sendo que no final do mês, este tempo é contabilizado e posteriormente confrontado com a métrica a ser utilizada, se 24X7 ou 18X6. A segunda parte se refere aos links de comunicação onde é utilizado um software de monitoramento que apresenta o downtime do período a ser analisado. Um aspecto importante sobre a medida da disponibilidade e ressaltado pelo Entrevistado D foi que os indicadores de disponibilidade estão fortemente ancorados nos ativos e não nos serviços e complementa dizendo que: Existem alguns indicadores para parada de servidores, manutenções programadas, canais de comunicação no ar, mas estão relacionados com o catálogo de serviços da infraestrutura e não com o catálogo de serviços do usuário. Então podemos ter uma alta disponibilidade num canal de comunicação, mas se parou o servidor de que atende área do Desenvolvimento, por exemplo, para eles representará que o serviço está indisponível, o que para nós representa apenas um item da área de comunicação que parou. Na questão que seguiu, foi perguntado aos entrevistados como era definido o índice de disponibilidade dos serviços oferecidos pela TI, sendo que a resposta mais incisiva foi a do Entrevistado D ao dizer que “acredito que até houve um nível de entrevista com usuários, (...) mas penso ter sido muito em cima da atual infraestrutura e da capacidade desta estrutura. Os demais entrevistados não demonstraram muita clareza em suas respostas sobre este assunto, se limitando a comentarem que os índices eram estipulados junto ao cliente. De nada adianta a TI procurar atingir um alto índice de disponibilidade dos recursos que possui e dos serviços que fornece se não controlar os serviços prestados pelos seus fornecedores, então foi questionado se os serviços terceirizados são monitorados com relação à disponibilidade. As respostas obtidas evidenciam que os serviços terceirizados são controlados, mas não exatamente monitorados com relação à disponibilidade, com exceção dos links de comunicação, pelo fato da TI utilizar softwares que permitem monitorar toda sua rede de comunicação de dados. O Entrevistado C comenta que o acompanhamento dos serviços terceirizados ainda é realizado de maneira inadequada, mas que está evoluindo e estão sendo trabalhadas medidas para se chegar a um nível ideal de monitoramento. Conforme ele explica, “os serviços terceirizados são acompanhados e mensalmente o técnico responsável por este acompanhamento preenche uma planilha de satisfação levando em consideração cinco itens de atendimento”. Ainda de acordo com o Entrevistado C e reforçado pelo Entrevistado E, no momento que o serviço de algum fornecedor ficar abaixo da média pré-estabelecida, este é notificado sobre sua situação, devendo então preparar um plano de ação para corrigir as falhas. Para os fornecedores que estão cumprindo com os SLA’s contratados, é fornecido um feedback informando que o serviço está sendo realizado com boa qualidade e dentro dos padrões esperados. Na questão seguinte foi perguntado como é avaliada a confiabilidade dos serviços e recursos e o tempo médio entre incidentes ou falha de componentes. Conforme as respostas recebidas, ficou evidenciado que não existe um processo de análise do tempo médio entre incidentes e de acordo com o Entrevistado D, a TI possui os dados necessários, que podem ser obtidos através do histórico do equipamento, mas não possui a cultura de trabalhar estes dados a fim de obter informações que poderiam ser importantes para o controle dos índices de disponibilidade. Seguindo o mesmo pensamento, o Entrevistado B comenta que “quando o problema ocorre em um componente, este é substituído um novo, com pequenas chances de apresentar a mesma falha. 12 Sendo o problema em algum sistema, o suporte técnico é bastante qualificado, apresentando baixo grau de recorrência de erros pelo mesmo motivo”. Em relação aos riscos, foi perguntado aos entrevistados se os riscos de indisponibilidade nos recursos ou serviços são calculados. Não há dúvida entre os entrevistados que este é um processo ainda incipiente, podendo ser comprovado pelo comentário do Entrevistado B ao afirmar que “os riscos são analisados pela experiência como, por exemplo, no caso dos servidores que estão com o prazo de garantia terminando é providenciada a substituição destes equipamentos, a fim de diminuir os riscos de uma eventual indisponibilidade”. Para o Entrevistado E, não existe um tratamento específico com relação aos riscos de indisponibilidade e que os trabalhos realizados em relação a este assunto são baseados em tendências observadas a partir de relatórios de monitoramento de recursos e conforme colocado anteriormente pelo Entrevistado B, através da experiência dos profissionais, que durante suas atividades conseguem perceber anomalias e providenciar uma solução antes que esta anomalia se torne um problema. Na questão seguinte foi perguntado aos entrevistados a respeito de como era realizado o balanceamento entre a disponibilidade exigida de um recurso ou serviço e o custo requerido para alcançar este índice. O Entrevistado A comenta que é “realizado um estudo de viabilidade pelo Comitê de TI, que é composto por um profissional de infraestrutura e um de desenvolvimento dos projetos apresentados. O Entrevistado A complementa dizendo que “são apresentadas três alternativas, desde a mais barata até a mais cara e cabe ao diretor aprovar qual será adotada”. O Entrevistado A encontra respaldo nas declarações do Entrevistado C ao citar como exemplo o projeto de criação de um Site Backup, onde “tínhamos um projeto que poderia custar 150 mil reais e outro com custo de até 30 mil reais, sendo decidido pelo diretor após analisar a relação custo/benefício, um projeto com valor de investimento perto de 70 mil reais”, o Entrevistado C salienta que este não é o projeto perfeito, mas que atenderá adequadamente as necessidades da empresa, e explica que mesmo com este projeto, os riscos são muito pequenos, pois conforme ele comenta: Teria que acontecer uma catástrofe muito grande, como por exemplo, desaparecer todo o local onde está situado a empresa e o escritório, localizado em outra cidade, e mesmo assim acreditamos que perderíamos apenas uma semana de trabalho, o que no caso de ocorrer um desastre desses, esta semana seria o menor dos nossos problemas. Segundo o Entrevistado B, para projetos menores, o custo adicional proveniente da solicitação de um índice de disponibilidade maior que o suportado pela atual estrutura de TI, ou o sugerido pela TI no projeto, será repassado ao Comitê gestor da área solicitante e caberá a este, o poder decisório da escolha a ser tomada. A penúltima questão da entrevista procurou identificar quais no entendimento dos entrevistados, são as principais vulnerabilidades na infraestrutura que podem comprometer a disponibilidade. Há um consenso entre os entrevistados a respeito de vulnerabilidades físicas da estrutura, vírus de computadores e operacionais. O Entrevistado A cita riscos de enchentes, fogo, ameaças de vírus e patches de atualização de software. Já o Entrevistado B salienta o risco de problemas elétricos no CPD e os problemas nos links de comunicação “por não dependerem exclusivamente da TI”. Um ponto destacado pelo Entrevistado D foi que, no seu entendimento, “a principal vulnerabilidade de uma organização é comportamental e não tecnológica”. O Entrevistado C acrescenta ainda que “boa parte das ações necessárias para tornar uma organização segura, devem ser em função do comportamento do usuário e não somente relacionadas à tecnologia”. Além das vulnerabilidades citadas anteriormente, o Entrevistado E acrescenta a questão do problema causado por novas implementações que não são testadas adequadamente antes de colocá-las em produção. O Entrevistado C faz menção também às redes wireless, que atualmente têm sido fortemente difundidas, mas nem sempre existe a preocupação com a segurança, representando uma ameaça à integridade das informações que circulam pela rede. Finalizando a entrevista foi perguntado aos entrevistados qual o planejamento para minimizar os impactos no momento de falha de serviços ou recursos. O Entrevistado A comenta que está sendo elaborado um plano de continuidade devendo ficar pronto até Março de 2012 e dá destaque ao backup dos dados da empresa que é severamente auditado, visando garantir a fidelidade dos dados na eventual necessidade de restauração dos backups. 13 O Entrevistado B destaca a utilização de tecnologia de virtualização dos servidores, que permite a rápida transferência da máquina virtual para um novo equipamento, restaurando o serviço num espaço de tempo menor que o necessário para reinstalar o sistema operacional e todos os softwares necessários. Outro aspecto enfatizado pelos entrevistados foi o projeto do Site Backup que prevê a redundância da estrutura do CPD em local externo a empresa. O Entrevistado D observa que existe um plano de comunicação e que no momento que se detectado algum problema, é feito um comunicado aos analistas responsáveis e o suporte é informado, pois sendo o principal ponto de contato do usuário com a TI, será o responsável por manter os clientes informados sobre a situação e as providências que estão sendo tomadas para resolver o problema. O Quadro 3 apresenta a síntese das entrevistas. Quadro 3 – Resumo das respostas, entrevista sobre Gerenciamento de Disponibilidade Variável Síntese No entendimento dos entrevistados, disponibilidade é propiciar que um serviço ou recurso esteja disponível para utilização no Conhecimento momento que for solicitado e com desempenho Conhecimento suficiente para não alterar a produção do usuário. Analisando sob a ótica do cliente, os entrevistados acreditam que a disponibilidade está relacionada com o nível de serviço e a quantidade recebida e de tempo de resposta. Não existem planos formais para gerenciamento de disponibilidade. Os principais recursos e serviços são monitorados, com exceção dos canais de comunicação, não existem softwares Monitoramento e Medidas para verificar a disponibilidade efetiva dos recursos. Os controles são manuais e os tempos de indisponibilidade são contabilizados a partir do momento que é detectado a parada de um serviço. A disponibilidade dos recursos, segundo os entrevistados, está em torno de 95 a 99%. O risco de indisponibilidade por falha de recursos ou serviços é um processo ainda incipiente e Riscos tratado basicamente através da experiência dos profissionais e pela análise de relatórios verificando-se a tendência de algum recurso apresentar problemas. Foram apontadas vulnerabilidades físicas, Vulnerabilidades problemas elétricos, ataques de vírus, atualizações de sistemas sem os devidos testes e comportamentos dos usuários. Está sendo desenvolvido um plano de Impacto nos Negócios continuidade e existe um projeto aprovado para a criação de um site backup, que prevê a redundância da estrutura do CPD, aumentando os índices de disponibilidade. 14 4.4 Análise da Disponibilidade dos Recursos Para a análise da disponibilidade dos recursos utilizados pelos serviços apontados como estratégicos para a empresa, buscou-se identificar a partir das informações obtidas nas entrevistas, os atuais índices de disponibilidade que são utilizados pela TI em seus indicadores. Concomitantemente, foram levantados através de observação participante, registros e documentos existentes, dados que pudessem corroborar com a validação destes índices. Um dos principais pontos observados é o fato de que o monitoramento da disponibilidade realizado pela TI está limitado aos componentes tecnológicos, não sendo monitorada de forma efetiva a disponibilidade dos serviços fornecidos ao cliente. O quadro 4 apresenta os índices de disponibilidade dos recursos de TI que são utilizados como parâmetro para os indicadores de disponibilidade. Quadro 4 – Índices de disponibilidade dos recursos Recursos Disponibilidade Desejada Servidores 99% Canais de Comunicação 99% Exchange 99% Banco de Dados Oracle 99% Para o monitoramento dos canais de comunicação, servidores e switches é utilizado pela TI o Software The DUDE. Este software monitora através dos protocolos ICMP e SMNP as interfaces de rede destes recursos, fornecendo informações sobre a disponibilidade do equipamento em termos de comunicação, tempos de resposta, percentual de utilização, pacotes perdidos, entre outros testes. Porém, cabe salientar que para os canais de comunicação este sistema fornece informações relevantes e que serão utilizadas como base para verificação do SLA contratado junto à prestadora de serviços, no caso a Oi. No entanto, para os servidores de rede, o monitoramento com este software pode criar divergências, pois ele mede somente a disponibilidade do equipamento, sendo indiferente se o serviço que roda neste servidor está funcionando ou não. Pode-se citar como exemplo destas possíveis divergências conforme citado anteriormente, o caso ocorrido durante a análise do monitoramento da disponibilidade dos recursos e serviços referentes ao mês de Outubro de 2008. Foi detectado no software de monitoramento, que a disponibilidade do Servidor de e-mail só não esteve com 100% de disponibilidade no Domingo dia 6 de dezembro, pois foi realizada uma manutenção programada na rede elétrica do CPD. No entanto, no dia 7 de dezembro o serviço de correio eletrônico esteve indisponível durante 20 minutos, no período compreendido entre 14h40min e 15h00min. Apesar de não ter comprometido o indicador de disponibilidade, este incidente ocorreu durante o expediente normal da organização e foi uma parada não programada. O Quadro 5 mostra uma comparação entre os indicadores de disponibilidade dos principais servidores no mês de Dezembro de 2010. Para o cálculo dos índices de disponibilidade dos servidores, foi calculada a média aritmética da disponibilidade de cada servidor a partir dos dados obtidos através do software The DUDE. Já a disponibilidade do serviço de e-mail foi obtida através do valor percentual que representou os 20 minutos de indisponibilidade que foram registrados oficialmente em relação ao período em que o serviço deve estar à disposição (24 X 7). Quadro 5 – Indicadores de disponibilidade dos servidores em Dez/2010 Disponibilidade Disponibilidade Disponibilidade de Recurso Desejada De Equipamento Serviço 99% 99,79% 99,953% Servidor de email Servidor de Produção 99% 99,79% 100% Servidor de Desenvolvimento 99% 99,79% 15 100% Aos demais serviços foram atribuídos 100% de disponibilidade, mas estes números não puderam ser comprovados, pelo fato de não existir o monitoramento dos serviços além dos registros realizados pelos próprios técnicos responsáveis. E durante o mês de Dezembro não foi registrado nenhum incidente de indisponibilidade. Após estas constatações, verifica-se a necessidade da utilização de alguma ferramenta que seja capaz de monitorar tanto o componente tecnológico quanto o serviço fornecido por este recurso. Foram observadas ações de pró-atividade que visam garantir maior disponibilidade, ou no mínimo, diminuir os riscos de ocorrer uma indisponibilidade durante o expediente normal na empresa. O horário padrão de início das atividades dos clientes é às 08h30min, sendo que um integrante do Gerenciamento de Problemas começa seu expediente uma hora antes e executa uma série de procedimentos, onde é verificado o funcionamento dos principais sistemas, canais de comunicação e ativos de rede. Caso seja encontrada alguma anomalia, são realizadas as ações necessárias para correção do problema e registrado um atendimento referente a indisponibilidade. A seguir é proposto um plano de ação para o gerenciamento da disponibilidade. 5 5.1 DIAGNÓSTICO ATRAVÉS DAS MELHORES PRÁTICAS - ITIL Pontos Fortes O processo está definido, documentado e é auditado semestralmente. Requisitos do cliente são obtidos e suas necessidades compreendidas. As horas de serviço são adequadas para atender as necessidades do negócio. A disponibilidade dos componentes funções de negócios é monitorada. É controlado o tempo médio entre falhas dos componentes de TI, inclusive fornecidos e mantidos por terceiros. A disponibilidade é definida e informada em tempo de projeto. É controlado o acesso lógico e físico aos componentes dos serviços. 5.2 Pontos Fracos Não há armazenamento e análise histórica de métricas de disponibilidade em todas as perspectivas: componentes, serviços e negócios. Não são avaliados sistematicamente a confiabilidade e os tempos médios entre incidentes nos serviços, tempo médio para reparo e tempo médio entre falhas em componentes. Não são utilizadas técnicas para melhoria dos níveis de disponibilidade. Não é elaborado um Plano de Disponibilidade estratégico por serviço/cliente. As interfaces com outros processos estão definidas, porém, não está funcionando efetivamente. 5.3 Plano de Ações para Melhorias O desenvolvimento do plano de ação para o gerenciamento de disponibilidade tem sua base apoiada nos dados e informações obtidas através da coleta e análise dos dados. O objetivo deste plano é propor ações a serem tomadas permitindo uma consolidação das práticas já adotadas, controle e melhoria da disponibilidade e confiabilidade dos recursos. Estas ações visam atender requisitos referentes à configuração, monitoração e tendências de disponibilidade dos serviços de TI e seus componentes. As metas a serem atingidas devem ser factíveis com os acordos de nível de serviços, devendo incluir a revisão dos índices de disponibilidade dos recursos de TI, identificação dos níveis que estão abaixo do acordado e investigação das razões pelas quais estes níveis não estão sendo alcançados. O plano de ação proposto é apresentado no Quadro 6. 16 Ações Definir formalmente o processo de Gerenciamento de Disponibilidade Quadro 6 – Plano de Ação para melhorias Resultados Procedimentos Recursos Esperados Adicionais Maior integração Definir com os processos de responsável Gerenciamento de pelo processo e Incidentes, equipe Problemas e integrante Mudanças Investigar a causa dos incidentes de maior impacto mensal Criar Banco de Dados do Gerenciamento de Disponibilidade (BDGD) Promover a melhoria contínua nos índices de disponibilidade Criar plano de disponibilidade para cada recurso gerenciado Diminuir índices de indisponibilidade decorrentes de incidentes reincidentes Base de conhecimento com armazenamento e análise histórica de métricas de disponibilidade Alcançar maior índice de disponibilidade dos recursos Adquirir Switches gerenciáveis Melhoria no desempenho da rede lógica, diminuição dos tempos de resposta, eliminação de cascateamento e controle do tráfego de dados na rede 5.4 Obter melhorias da disponibilidade Realizar atividades de pró-ativas para evitar reincidências Manter repositório Relatórios de indicadores de incidentes e problemas Utilizar técnicas para melhorias da disponibilidade (PDCA) Registrar objetivos, providencias, custos, recursos utilizados e prazos com base nas informações do BDGD Realizar Software The orçamento para DUDE compra dos switches Prioridade Alta Prazo de Implantação Imediato Alta Curto Média Longo Média Médio Baixa Longo Baixa Longo Indicadores de Desempenho Para garantir a disponibilidade e confiabilidade dos serviços e recursos de TI e promover a melhoria continua dos níveis de serviço oferecidos e o alcance dos objetivos organizacionais, deve-se medir o desempenho dos processos através de indicadores. Estas medidas devem possuir um valor agregado, tenham significado e tragam benefícios tanto para a área de TI quanto para a organização. Estas métricas devem ser obtidas sob diferentes perspectivas de disponibilidade, pois conforme visto na análise das entrevistas e no referencial teórico, a visão de disponibilidade do cliente é diferente da visão que a TI possui. 17 A TI trata a disponibilidade dos componentes considerando a disponibilidade do recurso, a confiabilidade e a capacidade de manutenção. A visão do usuário por sua vez, é influenciada pela freqüência das falhas, duração, tempos de resposta e do escopo do impacto. Os indicadores sugeridos no Quadro 7 procuram contemplar todas as perspectivas, pois muitas vezes um recurso pode ter um alto índice de disponibilidade para a TI, mas para o usuário que utiliza o serviço, estes números não condizem com a sua realidade. Quadro 7 – Quadro de Indicadores Sugeridos Indicador Definição Disponibilidade dos ((Tempo de serviço acordado- Tempo recursos de TI de inatividade)/Tempo de serviço acordado) *100 Quantidade de (Componentes monitorados/ componentes Quantidade de monitorados componentes do BDGD) * 100 Índice de serviços (Quantidade de serviços com SLA cuja disponibilidade atendido/ cumpre SLA quantidade de serviços com SLA definido) *100 Duração das falhas tempos de falha < 7,3 hs (serviços 24x7) Duração das falhas tempos de falha < 4 hs (serviços 18x6) 1- (freqüência falhas/freqüência Redução da freqüência das falhas de falhas mês anterior) * 100 6 Meta 99% Periodicidade Mensal 99% Mensal 99% Mensal 7,3 Mensal 4 Mensal 5% Mensal CONCLUSÃO A Tecnologia da Informação exerce cada vez mais, dentro do contexto organizacional, um papel estratégico, prestando serviços e fornecendo a infraestrutura que auxiliará as organizações a atingirem seus objetivos e permitindo uma resposta rápida frente novas demandas que surgem. Para isto, é necessário que as ações da TI sejam orientadas aos objetivos do negócio da organização. Como visto neste estudo de caso, o Gerenciamento de disponibilidade é responsável por grande parte da percepção de qualidade dos serviços da TI, tanto por parte dos usuários finais quanto da própria visão de negócio da organização. Sendo assim, a adoção formal do Gerenciamento da disponibilidade dos recursos e serviços de TI, pode contribuir significativamente para a maturidade dos processos da Empresa, melhorando a qualidade dos serviços prestados. Os objetivos propostos foram alcançados, na medida em que eram realizadas as análises dos dados coletados. Entre os fatores limitantes da pesquisa pode-se considerar o fato da adoção das práticas do ITIL ainda estar em nível de maturação, e principalmente, devido ao Gerenciamento de disponibilidade ser, até então, muito pouco explorado academicamente. O desenvolvimento deste trabalho proporcionou ao autor o aumento do conhecimento e da experiência acadêmica, superando as expectativas inicialmente desejadas. Propiciou também uma visão mais estratégica e menos operacional em relação à função da TI para os objetivos da Empresa, contribuindo para que o planejamento do trabalho proposto seja alcançado e se possível num espaço de tempo menor ao que anteriormente planejado. Sugere-se para um estudo posterior, aprofundamento acadêmico sobre o Gerenciamento de disponibilidade, realização de benchmarking com outras empresas e o planejamento de uma infraestrutura de TI de alta disponibilidade. 18 REFERÊNCIAS ALBERTIN, Alberto Luiz; ALBERTIN, Rosa Maria de Moura. Tecnologia de informação e desempenho empresarial: as dimensões de seu uso e sua relação com os benefícios de negócio. São Paulo: Atlas, 2005. DUGMORE, Jenny; LACY, Shirley. A Managers Guide to Service Management. 4a ed.London: BSI, 2004. FERNANDES, Aguinaldo Aragon; ABREU, Vladimir Ferraz de. Implantando a Governança de TI: da estratégia à gestão dos processos e serviços. 2a ed. Rio de Janeiro: Brasport,2008. itSMF. Fundamentos do Gerenciamento de Serviços de TI baseado na ITIL. Amersfoort:Van Haren Publishing, 2006. MAGALHÃES, Ivan Luizio; PINHEIRO, Walfrido Brito. Gerenciamento de serviços de TI na prática: uma abordagem com base na ITIL. São Paulo: Novatec Editora, 2007. OFFICE OF GOVERNMENT COMMERCE (OGC). ITIL Service Design. United Kingdom: The Stationery Office, 2000a. OFFICE OF GOVERNMENT COMMERCE (OGC). ITIL V3 - Service Design. United Kingdom: The Stationery Office, 2007. STURM, Rick; MORRIS, Wayne; JANDER, Mary. Foundations of Service Level Management. Indianapolis: Sams, 2000. 19