Gerenciamento de Incidentes, segundo a ITIL Larissa R. Lira Aquino da Silva MBA Governança de Tecnologia da Informação Faculdade Católica de Cuiabá – Cuiabá, MT – Brasil [email protected] Abstract. Based on ITIL library, this article describes one of the best practice management services of a vital sector within a corporation, the sector of Information Technology. In brief way, the practice of managing incidents - GI - is to process activities and act in ways that allow pro-active in relation to incidents that could interrupt or reduce the quality of a particular service. Resumo. Baseado na biblioteca ITIL, este artigo descreve uma das boas práticas de gerenciamento de serviços de um setor imprescindível dentro de uma corporação, o setor de Tecnologia da Informação. De maneira breve, a prática de gerenciamento de incidentes – GI – consiste em processo e atividades que permitem agir de maneira pró-ativa em relação a incidentes que possam interromper ou reduzir a qualidade de um determinado serviço. 1. Introdução Todos estão sujeitos a mudanças constantes e inesperadas, e neste mundo de competitividade podem-se destacar, as corporações que estiverem preparadas com flexibilidade e agilidade na resolução de incidente e falhas de Tecnologia da Informação (TI). Sendo assim, cada vez mais se aumenta a necessidade de integração estratégica da área TI ao negócio, bem como da qualidade e controle dos serviços oferecidos. A partir de então, a TI não é mais vista somente como um mecanismo de suporte, mas sim, como um setor participante da alta gerência, provendo decisões estratégicas corporativas e conquistando, cada vez mais, o lugar de “braço direito” da presidência, do sócio-proprietário, do gerente geral. Enfim, ao lado de quem assume grandes responsabilidades dentro de corporações que visam maximização de valores. Logo, o guia de melhores práticas ITIL (Information Technology Infrastructure Library) descreve processos de gerenciamentos dos serviços de TI, os quais garantem a padronização de processos, viabilizando assim o tempo de resposta, custo e solução de problemas, isto é, contribui para problemática supracitada. Dentre os processos de gerenciamento de serviços será explanado neste artigo o funcionamento do gerenciamento de incidentes que tem como primordial responsabilidade solucionar incidentes com agilidade. 2. Referencial Histórico do ITIL Desenvolvido no final dos anos 80 pela Central Computer and Telecommunications Agency (CCTA), atualmente OGC – Office of Government Commerce, a ITIL foi criada para planejar serviços de TI no governo Britânico. Surgiram então as boas práticas de TI. Quando se fala em boas práticas refere-se a resultados significativos que atendem a melhoria da Tecnologia da Informação, isto é, operações de empresas, aprimoramento de níveis de serviços e corte de custos associados à inatividade de rede e trabalhos manuais. Passaram mais de dez anos, as corporações européias adotaram a ITIL, utilizando-a como um padrão aberto de planejamento e organização de TI cujo foco é a qualidade dos processos de Gerenciamento dos Serviços. A Versão 1.0 a ITIL foi composta por quase 40 livros, dando assim seu nome, Biblioteca da Infra-estrutura de Tecnologia da Informação. Já na Versão 2.0 a ITIL foi reformulada reunindo oito melhores praticas: Entrega de Serviços; Gerenciamento da Infra-Estrutura de TI e de Comunicação; Gerenciamento da Segurança; Gerenciamento de Aplicações; Gerenciamento dos Ativos de Software; Perspectiva do Negócio, Planejamento e Implementação e Suporte aos Serviços. Em 2007 foi lançada a Versão 3.0 ainda mais enxuta, a qual apresenta o conceito de gerenciamento de ciclo-de-vida do serviço em cinco livros que reúnem: estratégia, design, transição e operação de serviços e melhorias contínuas nos serviços. Apesar do lançamento da Versão 3.0, aqui a boa prática de gerenciamento de incidentes é baseada na Versão 2.0, pois está apresenta mais base de estudos que a versão recente. 3. Processos Um processo é constituído por um conjunto de atividades interligadas que partem de objetivos estipulados e são executadas a fim de atingir resultados pré-definidos entre os envolvidos em um determinado processo. Os objetivos que cercam o gerenciamento de processos são o aumento da qualidade dos serviços, aumento da previsibilidade do comportamento e diminuição de custo alocado. Com isso, gerenciar os serviços de TI através de processos pressupõe organização, padronização e controle de atividades, e mais, melhor comunicação entre nível operacional, tático e até mesmo com o nível estratégico de uma corporação. 4. Gerenciamento de Incidentes (GI) “Incident, any event wich is not part of the standard operation of a service and wich causes, or may cause, an interruption to, or a reduction in, the quality of that service”. Traduzindo em poucas palavras, segundo a ITIL, incidente é todo evento que não faz parte da rotina do modelo de gestão de um serviço, podendo causar uma interrupção ou redução na qualidade do serviço prestado. Gerenciar incidentes é garantir que estes eventos atípicos sejam solucionados o mais breve possível, minimizando o impacto e garantindo que estes atendam aos níveis de serviços pré-estabelecidos entre TI e corporação. E ainda, para propiciar uma eficácia no GI tem-se a necessidades da interação com outros processos de gerenciamentos da ITIL, especialmente, Gerenciamento de Problemas e Gerenciamento de Mudança. Antes da abordagem em relação ao processo e as atividades mencionadas é necessária à compreensão de alguns conceitos relevantes, são eles: • Initial support team – também chamada de Suporte de Primeiro Nível, é a equipe responsável pelo pronto atendimento as solicitações feitas por usuários através do • • • • • • service desk. Além disso, são os responsáveis pela identificação e diagnóstico dos incidentes e pela sua resolução caso tenha uma solução conhecida; Workaround – ou solução de contorno. É a maneira conhecida de resolver um incidente específico que permite o serviço voltar ao normal. Para está técnica ou ajuste não há resolução permanente do incidente, são apenas soluções temporárias; Know Error – podendo ser chamado também por “erro conhecido”. É o problema que tem uma workaround ou solução definitiva identificada; Problem – Causa raiz desconhecida de um ou mais incidentes; Service desk – pode ser traduzido como central de atendimentos ou central de serviços, o service desk é a ponte de contato entre os stakeholders (customers, users, IT sevices and third-party support organizations) e o setor de Tecnologia da Informação de uma instituição, pois é a central que monitora os processos de solução dos incidentes ou das solicitações de serviços registradas. Service Request – trata-se da requisição de um serviço inédito ou alteração de um já existente. Os tipos mais comuns são Requests For Change (RFCs) e Requests For Information (RFIs). Soluction/permanent fix – o contrario do Workaround que fornece uma solução temporária, permanent fix denomina a forma possível e definitiva de resolver a causa de um incidente ou problema. 4.1 Processo e atividades No processo e nas atividades, demonstrados na figura 01, que permite a visualização das etapas do processo de gerenciamento de incidentes. O início de um processo de GI se dá quando um usuário realiza uma solicitação de serviço através do service desk ou através da detecção por meio de algum “event management system”, sistemas que monitoram e gerenciam as atividades dos sistemas e geram alertas em caso de alteração dos padrões normais de operação. Neste primeiro momento são registrados detalhes básicos do incidente, que é importante para construção de um histórico para uso posterior. São realizadas catalogações na base de dados do service desk, pois futuramente este incidente pode ser identificado e utilizado tanto para o próprio service desk como indício de que a constância de tal problema já foi percebida cabendo a outros níveis de suporte tomar os devidos procedimentos para aniquilá-lo. Posteriormente, o analista do 1° nível de suporte busca em seus registros um caso similar ao que está sendo analisado no momento. Ao encontrar, uma situação semelhante, deve aplicar workaround ou solução definitiva proposta, solucionando o incidente. Caso contrário, o incidente deverá ser escalonado para o 2° nível de suporte. Já no 2° nível é feito o monitoramento detalhado, incluindo os IC (itens de configuração) afetados. Dá-se inicio a solução do incidente, caso a pesquisa de solução não seja cabível para o problema encontrado, passa-se para o 3° nível onde o processo se reinicia a partir do nível anterior, ou seja, não existe um nível final e sim um retorno ao 2° nível isso caso a solução inicialmente detectada não tenha sido solucionada com satisfação e não tenha atendido os níveis de serviço estabelecidos. Figura 1. Processo de Gerenciamento de Incidentes. Através da avaliação detalhada das informações registradas, uma das atividades do processo, ocorrerá à classificação e suporte inicial onde o incidente será categorizado (hardware/software/requisição/segurança...) e sua prioridade será definida, levando em consideração o impacto sobre o negócio do serviço e urgência com que o incidente deve ser solucionado. Ao final, o analista deve informar o service desk o qual contacta o usuário a fim de verificar se a solução foi satisfatória e eficaz, obtida resposta positiva o processo se encerra e o incidente pode ser fechado. Durante o processo de gerenciamento, o incidente assume alguns estados que caracterizam seu ciclo de vida bem como o processo acima mencionado. Os estados podem ser denominados como: Novo: Estado do incidente ao ser registrado. Aceito: O incidente é denominado de “aceito” após sua primeira análise e classificação quanto sua prioridade. Programado: O estado de “programado” indica que o incidente aguarda atendimento, já foi aceito e espera a definição de um analista para execução de atendimento técnico. Atribuído: Incidente repassado a um técnico responsável Em andamento: O incidente neste estado significa que sua investigação e diagnostico já foram iniciados. Em espera: O incidente neste estado significa que sua investigação e diagnostico foram suspensos. Resolvido: Foi implementado workaround ou permanent fix e aplicado ao incidente. Serviço de TI afetado foi solucionado. Encerrado: A equipe do service desk contacta o usuário, informa que o serviço foi solucionado e obtém a confirmação da restauração do serviço de TI. Manter a padronização quanto às características dos estados no ciclo de vida de um incidente permite melhor assimilação de todos da equipe, assim qualquer membro saberá o andamento de determinada requisição. Vale lembrar, outro fator relevante, para melhor entendimento, o escalonamento do incidente, realizado durante seu atendimento, é o método utilizado para obtenção de resultados em menor período de tempo, podendo ser de duas formas, escalonamento vertical e escalonamento horizontal. Ocorre escalonamento horizontal quando se torna necessária a transferência da resolução do incidente a outros níveis de suporte técnico, já o escalonamento vertical baseia-se na obtenção de mais suporte técnico, dinheiro, pessoas atuantes e poder de decisões, ou seja, recursos necessários para resolução do incidente. 5. Conclusões Comprometimento, reconhecimento de aplicabilidade, praticidade e acessibilidade por parte dos usuários dos serviços de TI e da própria equipe que a compõe garantem o bom funcionamento do gerenciamento de incidentes e conseqüentemente da melhoria dos serviços fornecidos. E ainda, pode-se dizer que todos se beneficiam, o negócio com a redução do tempo de impacto que um incidente pode causar e a TI que passa a gerenciar com mais critério seus recursos (pessoas e equipamentos) e as informações que detêm. Ressaltando que, além disso, é necessário ponderar o tempo de resolução do incidente e preocupar-se com o desempenho da equipe de especialistas dos níveis de escalonamento para que não sejam incomodados e não percam a qualidade do serviço que estarão desenvolvendo, pois incidente mal resolvido ou perdido pressupõe problema. 6. Referências Magalhães, Ivan Luizio; Pinheiro, Walfrido Brito. (2007) “Gerenciamento de serviços de TI – uma abordagem com base na ITIL”. Editora Novatec, Rio de Janeiro, Brasil. Marques, Cleber. (2007) “Gerenciamento de Incidentes-SMF”, http://www.linhadecodigo.com.br/Artigo.aspx?id=1533. Acesso em: fev. 2008. CCE USP. “Domínios do http://www.usp.br/cce/qualidade/downloads/IIIEncontroGerentes_parteII.pdf. em: fev. 2008. ITIL”, Acesso Ghedini Ralha, Célia. “Modelo ITIL Quadrante de Suporte MOF Gerência de Incidentes”, aprender.unb.br/mod/resource/view.php?inpopup=true&id=29279. Acesso em: fev. 2008. Vernay, Diogo. (2007) “Gerenciamento de Incidentes-ITIL”, http://www.devmedia.com.br/articles/viewcomp.asp?comp=7174. Acesso em: fev.2008.