Gerenciamento da alimentação elétrica e de refrigeração para data centers Relatório 150 Revisão 1 Neil Rasmussen > Resumo executivo Equipamentos de TI de alta densidade exigem maior capacidade de densidade de potência em data centers modernos. A instalação e proliferação desses equipamentos sem o devido gerenciamento podem provocar problemas inesperados na infraestrutura de alimentação e de refrigeração, por exemplo, superaquecimento, sobrecarga e perda de redundância. A capacidade de medir e prever a necessidade de alimentação elétrica e de refrigeração nos racks é necessária para assegurar desempenho previsível e otimizar o uso dos recursos da infraestrutura física. Neste relatório técnico são apresentados os princípios para realizar o gerenciamento da capacidade de alimentação de energia elétrica e de refrigeração. Conteúdo clique em uma seção para ter acesso a ela Introdução 2 Histórico 2 Fornecimento e demanda de capacidade 4 Capacidades no nível do sistema 7 Gerenciamento da capacidade 10 Monitoramento da alimentação elétrica e refrig-eração para equipamentos de TI 14 Conclusão 16 Recursos 17 Gerenciamento da alimentação elétrica e de refrigeração para data centers Introdução > Gerenciamento de capacidade Fornecer infraestrutura... No Momento Adequado Na Quantidade Adequada Pelo Preço Adequado E, usar com Eficiêcia De acordo com a Gartner Inc., a maioria dos operadores de data centers não conhece as cargas e a capacidade atual de alimentação de energia elétrica e de refrigeração de seus data centers, mesmo no nível global. A instalação de equipamentos que ultrapassam a densidade de projeto do data center e as cargas resultantes sobre os sistemas de alimentação de energia elétrica e de refrigeração estão causando interrupções devido a sobrecargas, superaquecimento e perda de redundância. A Biblioteca de Infraestrutura de Tecnologias da Informação (ITIL, por sua sigla em inglês) define Gerenciamento da Capacidade como a disciplina que assegura o provimento da infraestrutura necessária no momento adequado, na quantidade adequada, ao preço adequado, para ser utilizada da forma mais eficiente possível. Os fatores essenciais para o sucesso desta atividade são: • Oferecer previsões precisas sobre a capacidade; • Proporcionar capacidade adequada para atender as necessidades da empresa. Para isso, é preciso receber informações provenientes de diversas áreas da empresa, para identificar quais sistemas de TI são (ou serão) necessários, que infraestrutura de alimentação de energia elétrica e de refrigeração é necessária para suportar estas cargas de TI, que nível de contingência será necessário e qual será o custo da infraestrutura. Neste Relatório Técnico é aplicado a visão da ITIL sobre gerenciamento de capacidade especificamente para os problemas de capacidade de alimentação elétrica, refrigeração e espaço dos data centers. Um modelo é apresentado para quantificar o fornecimento e a demanda de alimentação elétrica e de refrigeração e para gerenciar os diversos tipos de capacidade. Este modelo pode servir como uma estrutura básica para descrever um sistema de gerenciamento de capacidade ou para estabelecer diretrizes sobre o gerenciamento de níveis de serviço. Incident Management Figura 1 O gerenciamento de capacidade é, conforme a ITIL, um processo de i Service Level Management Change Management Capacity Management Release Management ITIL Service Support processes Focused on end users Histórico IT Service Community Management Availability Management Problem Management IT Financial Management ITIL Service Delivery processes Focused on business owners Configuration Management A habilidade para estabelecer a capacidade de alimentação elétrica e de refrigeração em um rack específico é muito rara. Geralmente os operadores de data centers não têm as informações necessárias para implementar novos equipamentos de forma eficaz na velocidade exigida pelos negócios e não podem responder questões simples, como: APC by Schneider Electric Relatório 150 Revisão 1 2 Gerenciamento da alimentação elétrica e de refrigeração para data centers • Em que parte do data center devo implementar o próximo servidor de modo a não afetar a disponibilidade dos equipamentos existentes? • Do ponto de vista de disponibilidade de alimentação elétrica e refrigeração, qual a melhor localização para instalar os equipamentos de TI propostos? • Novos equipamentos poderão ser instalados sem gerar um impacto negativo nas margens de segurança, como a redundância e autonomia para fazer backups de proteção? • Continuará havendo redundância de alimentação elétrica ou refrigeração em condições de falha ou de manutenção? • Podem ser implementadas novas tecnologias de hardware, como servidores Blade, utilizando a infraestrutura de alimentação elétrica e refrigeração existente? • É preciso distribuir os servidores Blade para obter funcionamento confiável? • Quando a infraestrutura de alimentação elétrica e refrigeração atual chegará a seu limite e exigirá capacidade adicional? É frequente, porém inaceitável, não ter respostas para estas questões simples. Em data centers superdimensionados ou com muita capacidade ociosa, as margens de segurança podem possibilitar o funcionamento bem-sucedido apenas tendo um conhecimento básico do desempenho total do sistema. Quando a disponibilidade é comprometida devido a essa falta de conhecimento, podem ocorrer interrupções de curta duração, porém toleráveis. Embora não seja a opção mais rentável, o superdimensionamento oferece uma margem de segurança a curto prazo até se atingir o ponto em que a capacidade disponível é igual à capacidade utilizada. No entanto, existem atualmente três fatores que afetam a demanda nos data centers e trazem à tona as fraquezas dos métodos de operação atuais: • Equipamentos de TI com densidade ultra-alta; • A necessidade de controlar o custo total de propriedade (TCO) e usar os data centers de forma integral; • A velocidade de mudança e de atualização dos equipamentos de TI. Cada um destes fatores exige que os data centers funcionem de uma forma mais previsível. Equipamentos de TI de alta densidade Os equipamentos de TI que consomem mais de 10kW por rack podem ser considerados de alta densidade. Racks de servidores completamente ocupados podem consumir de 6 kW a 35 kW por rack. Mesmo assim, a grande maioria Demanda Nº 1 no data center dos data centers atuais são projetados para uma Equip. de TI de alta densidade densidade de potência menor que 2 kW por rack. Como já foi mencionado, cada vez mais usuários Sobrecargas instalam equipamentos que ultrapassam a Superaquecimento densidade de projeto de seus data center, e a demanda resultante sobre os sistemas de alimentação elétrica e de refrigeração provocam Perda de redundância interrupções devido a sobrecarga, superaquecimento e perda de redundância. Os operadores de data centers precisam de melhores informações sobre como e quando implementar estes equipamentos de forma confiável em data centers existentes e novos. APC by Schneider Electric Relatório 150 Revisão 1 3 Gerenciamento da alimentação elétrica e de refrigeração para data centers Custo total de propriedade A maioria das empresas não pode aceitar data centers superdimensionados ou superprojetados. A despesa com custos operacionais e de capital é significativa. Estima-se que atualmente um data center típico poderia Demanda Nº 2 no data center acomodar até 30% mais de equipamentos de TI Pressão sobre o TCO usando a mesma capacidade de alimentação elétrica e refrigeração do estabelecimento se a Capacidade sem uso capacidade fosse gerenciada adequadamente. Um data center típico atualmente não pode usar por Eficiência reduzida completo a capacidade de alimentação elétrica e de refrigeração disponível, reduzindo a eficiência Desperdício invisível do sistema e elevando o consumo de energia em 20% ou mais, quando comparado com um sistema com gerenciamento adequado da capacidade. Ferramentas de gerenciamento de capacidade permitem Ritmo acelerado de mudanças Os equipamentos de TI de um data center típico estão em constante mudança. Em geral os ciclos de atualização de equipamentos ocorrem a cada três anos, ou menos, e constantemente estão se adicionando ou eliminando equipamentos. Além disso, os requisitos de alimentação elétrica e de Demanda Nº 3 no data center refrigeração dos dispositivos de TI não são Mudanças rápidas constantes, mas variam a cada minuto, como resultado dos recursos de gerenciamento de Ciclo de atualização de 3 anos energia implementados pelos fornecedores dos equipamentos de TI. Mudanças de equipamentos dia a dia O método histórico de “tentativa e erro” para a Mudanças na carga minuto a minuto implementação de equipamentos de TI já não é viável, pois o resultado habitual é o superaquecimento. As ferramentas de gerenciamento de capacidade devem oferecer recursos de planejamento em tempo real, para encarar estes desafios e devem oferecer essas possibilidades de forma econômica e pré-estruturada, e simples de instalar e utilizar. Fornecimento e demanda de capacidade Para dar respostas simples às questões básicas que os usuários têm sobre a capacidade, é necessária uma abordagem sistemática de gerenciamento da capacidade. A base do gerenciamento da capacidade é poder quantificar o fornecimento e a demanda, tanto da alimentação elétrica quanto de refrigeração. Embora seja útil ter informações sobre o fornecimento e a demanda de alimentação elétrica e de refrigeração na sala ou no estabelecimento, isto não oferece dados suficientemente detalhados para responder questões sobre implementações de equipamentos de TI específicos. Por outro lado, fornecer informações sobre o fornecimento e a demanda de alimentação elétrica e de refrigeração por dispositivo de TI é uma tarefa desnecessariamente detalhada e complicada. Um nível prático e eficaz para medir e estimar um orçamento da capacidade de alimentação elétrica e refrigeração é por rack, e essa é a abordagem utilizada neste Relatório Técnico (Figura 2). APC by Schneider Electric Relatório 150 Revisão 1 4 Gerenciamento da alimentação elétrica e de refrigeração para data centers ROOM (top view) Rack Figura 2 Rack Rack Nível de controle para gerenciamento de capacidade Rack Rack Rack Row Row Row Row Nível da SALA Muito amplo Nível do DISPOSITIVO Muito específico Nível do RACK O melhor para gerenciamento de capacidade O modelo apresentado neste Relatório Técnico quantifica o fornecimento e a demanda de alimentação elétrica e refrigeração por rack de acordo com quatro parâmetros importantes: • Demanda potencial máxima conforme configurado • Demanda real atual • Fornecimento potencial máximo conforme configurado • Fornecimento real atual Estas informações permitem uma descrição completa do estado atual da alimentação elétrica e da refrigeração por rack do data center. DEMANDA POTENCIAL máxima de alimentação elétrica e de refrigeração conforme configurado Os sistemas de gerenciamento de alimentação elétrica de servidores modernos podem causar a variação da potência entre 1 e 2 vezes ou mais durante uma operação típica. A demanda de alimentação elétrica e de refrigeração máxima “tal como estão configuradas” representa os valores máximos que podem causar essa variação no rack. Esse dado pode ser determinado no momento da configuração do sistema através da identificação de tendências, pode ser fornecido diretamente pelo equipamento de TI ou pode ser calculado por outros meios. A demanda máxima de alimentação elétrica e de refrigeração sempre é maior ou igual à demanda real de alimentação elétrica e de refrigeração, dado essencial para o gerenciamento de capacidade. DEMANDA REAL atual de alimentação elétrica e de refrigeração É o valor de potência consumida e de calor dissipado em cada rack em um determinado momento. Idealmente, é apurado por medições em tempo real do consumo de energia elétrica por rack. Para quase todos os dispositivos, a potência consumida em watts é igual ao calor dissipado em watts. Para outros dispositivos – como no-breaks (UPS), unidades de distribuição de energia (PDU), equipamentos de ar condicionado e roteadores para VoIP– a energia térmica produzida em watts não é igual à energia consumida, mas pode ser determinada matematicamente. O consumo de energia por rack pode ser medido pelo sistema de distribuição de energia elétrica ou pelo próprio equipamento de TI, e o consumo de energia do conjunto de dispositivos de TI dentro de um rack pode ser somado para se obter a potência do rack. APC by Schneider Electric Relatório 150 Revisão 1 5 Gerenciamento da alimentação elétrica e de refrigeração para data centers FORNECIMENTO POTENCIAL máximo de alimentação elétrica e de refrigeração tal como configurado O fornecimento de alimentação elétrica e de refrigeração conforme configurado é definido como a quantidade de alimentação elétrica e de refrigeração que poderia ser fornecida potencialmente no nível de rack pelos equipamentos de infraestrutura instalados. O fornecimento potencial de alimentação elétrica e de refrigeração sempre será maior ou igual ao fornecimento real de alimentação elétrica e de refrigeração. Se o fornecimento potencial for maior que o fornecimento real, isto significa que o sistema se encontra degradado. Essa degradação pode ser devida a diversos fatores, por exemplo: • Filtros de ar do sistema de refrigeração bloqueados; • Diminuição na capacidade de eliminação de calor para o exterior devido a condições ambientais extremas; • Perda de um módulo de potência em um no-break modular. Uma função importante do sistema de gerenciamento de capacidade é reconhecer quando o fornecimento real atual não equivale ao valor projetado e diagnosticar a origem das restrições do sistema que estão evitando a utilização total da capacidade de fornecimento projetada. FORNECIMENTO REAL atual de alimentação e refrigeração O fornecimento real de alimentação elétrica e de refrigeração em um rack é determinado a partir das informações sobre a arquitetura de distribuição de energia e de refrigeração do sistema de alimentação e refrigeração do data center, as capacidades reais atuais das fontes globais de alimentação e refrigeração e os efeitos sobre a capacidade disponível de outras cargas. O fornecimento real de alimentação em um determinado rack é apurado uma vez que se conhece a capacidade disponível do ramal do circuito que vai até o rack, limitada pela disponibilidade de energia não utilizada das fontes a montante, como as unidades PDU e os no-breaks. Em alguns casos, a capacidade disponível é ainda mais limitada pelo projeto ou pela configuração do sistema de alimentação elétrica. Por exemplo, é possível que um sistema modular não esteja totalmente ocupado ou que o projeto determine alimentação dupla de energia. Determinar o fornecimento real de refrigeração em um rack costuma ser mais complexo que determinar o fornecimento de energia elétrica, e depende em grande medida da arquitetura de distribuição de ar. Diferente da arquitetura de alimentação elétrica, na qual o fluxo de energia é limitado pelo cabeamento, a circulação de ar costuma ser fornecida a um grupo aproximado de racks, onde se distribui entre eles com base na tomada de ar dos ventiladores nos equipamentos de TI. Isto faz com que a apuração da capacidade disponível de ar seja mais complexa e sejam necessários sofisticados modelos computadorizados. Nos casos em que o ar de fornecimento ou de retorno é diretamente conduzido para os racks, é possível definir melhor o fornecimento de refrigeração em um rack e, portanto, apurá-lo com maior precisão. APC by Schneider Electric Relatório 150 Revisão 1 6 Gerenciamento da alimentação elétrica e de refrigeração para data centers Levels shown represent the general concept, not actual levels This difference represents unused computing capacity in the rack Figura 3 With virtualization, the rack’s actual will rise and fall as loads shift from rack to rack Design max Design max Design max Actual Actual Design max Over-sizing Actual Actual Some of this difference may represent infrastructure problems that can be fixed (typically worse for COOLING) Quantificação da demanda e fornecimento por rack Power and cooling DEMAND is typically the same – kW of power IN produces the same kW of heat OUT from rack equipment Capacidades no nível do sistema provided by infrastructure A demanda de alimentação elétrica e de refrigeração é estabelecida por rack. O fornecimento, como foi apresentado acima, também deve ser entendido e quantificado por rack. Entretanto, o sistema de fornecimento de alimentação elétrica e de refrigeração não é estabelecido para cada rack, mas é hierárquico, e nele vários dispositivos de fornecimento, como no-breaks, unidades PDU e equipamentos de ar condicionado alimentam um conjunto de racks. Dispositivos de fornecimento global, entre eles, o painel elétrico de entrada e as torres de resfriamento, também representam fontes de fornecimento de capacidade que devem ser suficientes para a demanda. Portanto, além de quantificar a capacidade de fornecimento de alimentação elétrica e de refrigeração por rack, ela também deve ser quantificada em todos os níveis agregados de acordo com os dispositivos de alimentação. APC by Schneider Electric Relatório 150 Revisão 1 7 Gerenciamento da alimentação elétrica e de refrigeração para data centers Figura 4 Fonte de demanda vs fonte de fornecimento O fornecimento deve sempre ser maior ou igual à demanda, para evitar falhas no data center. Isto deve ser atendido em cada rack e também em cada dispositivo de alimentação que alimenta grupos de racks. Portanto, em qualquer momento, sempre há excesso de capacidade. Para fins de gerenciamento de capacidade, a capacidade excessiva se apresenta de quatro formas diferentes: • Capacidade excedente ou reserva • Capacidade inativa • Capacidade para margens de segurança • Capacidade imobilizada Each of these types of excess capacity is explained in the following sections. Capacidade excedente ou reserva A capacidade reserva é a capacidade real atual excedente que pode ser utilizada “imediatamente” para novos equipamentos de TI. Ter capacidade excedente gera custos operacionais e de capital significativos, relacionados com a compra e manutenção dos equipamentos de alimentação elétrica e de refrigeração. Além disso, a capacidade excedente sempre diminui a eficiência operacional do data center e aumenta o consumo de energia elétrica. Recursos APC Relatório 143 Projetos de data centers: Modelo de expansão [em inglês] Em uma arquitetura eficaz de gerenciamento de capacidade de um data center em crescimento e mudança constante, certos tipos de capacidade excedente são econômicos, por exemplo, a capacidade excedente de conexão à rede elétrica. No entanto, é ideal que os equipamentos de alimentação elétrica e de refrigeração sejam instalados apenas quando e onde forem necessários para atender à demanda crescente. Um sistema eficaz de gerenciamento de capacidade deve englobar e quantificar planos de expansão. Para mais informações sobre a quantificação de planos de expansão, consulte o Relatório Técnico APC 143 Projetos de data centers: Modelo de expansão [em inglês]. APC by Schneider Electric Relatório 150 Revisão 1 8 Gerenciamento da alimentação elétrica e de refrigeração para data centers Capacidade inativa A capacidade inativa é a capacidade em excesso real atual que é mantida disponível para atender à demanda potencial máxima de alimentação elétrica ou de refrigeração conforme configurada. Os equipamentos de TI existentes poderiam precisar dessa capacidade em condições de carga máxima, portanto essa capacidade inativa não pode ser utilizada para alimentar novos equipamentos de TI. A capacidade inativa é um problema cada vez maior causado pelas funções de gerenciamento de alimentação elétrica dentro dos equipamentos de TI. Ela deve ser conservada para ocasiões nas quais os equipamentos de TI com gerenciamento de alimentação passam para o modo de alto consumo de energia. Capacidade para margens de segurança A capacidade para margens de segurança é a capacidade em excesso planejada que se mantém disponível acima e além da demanda potencial máxima de alimentação elétrica ou de refrigeração conforme configurada. Proporcionar uma margem de segurança permite o funcionamento do sistema em caso de pequenas falhas na configuração da demanda máxima potencial de alimentação elétrica e de refrigeração, ou em caso de se adicionarem equipamentos de TI não autorizados ao sistema. As margens de segurança típicas são de 10% a 20%, embora em data centers com procedimentos de controle de mudanças deficientes, elas possam atingir 30% ou mais. Isto significa que a capacidade não pode ser utilizada para implementações de novos equipamentos de TI. Capacidade imobilizada A capacidade imobilizada é aquela que as cargas de TI não podem utilizar devido ao projeto ou à configuração do sistema. A presença de capacidade imobilizada indica um desequilíbrio entre duas ou mais das seguintes capacidades: • Espaço no piso e no rack • Alimentação de energia elétrica • Distribuição de energia • Refrigeração • Distribuição de refrigeração Um equipamento de TI específico requer capacidade suficiente dos cinco elementos acima. No entanto, estes elementos quase nunca estão disponíveis em um equilíbrio perfeito de capacidade para coincidirem com uma carga de TI específica. Invariavelmente há locais livres no rack, mas sem refrigeração disponível, ou há locais com alimentação elétrica disponível, mas sem espaço livre no rack. Chama-se de capacidade imobilizada quando um determinado tipo de capacidade não pode ser utilizado pois uma das outras quatro capacidades acima está sendo utilizada ao máximo. A capacidade imobilizada é prejudicial e pode restringir seriamente o desempenho do data center. Infelizmente, a maioria dos data centers tem problemas significativos de capacidade imobilizada, entre eles os seguintes exemplos frequentes: • Um equipamento de ar condicionado com capacidade suficiente mas distribuição de ar inadequada para a carga de TI. • Uma unidade PDU com capacidade suficiente, mas não há posições disponíveis de disjuntores. APC by Schneider Electric Relatório 150 Revisão 1 9 Gerenciamento da alimentação elétrica e de refrigeração para data centers • Existe espaço disponível no piso, mas não resta capacidade de alimentação. • Os equipamentos de ar condicionado ocupam locais incorretos. • Algumas unidades PDU estão sobrecarregadas enquanto outras têm pouca carga. • Algumas áreas estão superaquecidas enquanto outras estão frias. Dependendo da situação e da arquitetura do sistema de alimentação elétrica e de refrigeração, poderia ser impossível usar a capacidade imobilizada, ou seria preciso apenas fazer pequenos investimentos para liberar a capacidade imobilizada e, assim, poder utilizá-la de forma eficaz. Por definição, a utilização da capacidade imobilizada tem um custo. Frequentemente é preciso desmontar parte da instalação ou instalar novos componentes de alimentação elétrica e de refrigeração. Para os operadores de data centers, a capacidade imobilizada é um problema muito frustrante de gerenciamento de capacidade, porque é muito difícil explicar aos usuários ou aos gerentes que um data center com 1 MW de capacidade de alimentação elétrica e de refrigeração instalada não pode refrigerar os novos servidores Blade quando está funcionando com apenas 200 kW da carga total. Um sistema de gerenciamento de capacidade eficaz não só identifica e destaca a capacidade imobilizada, mas também ajuda os clientes a evitarem diretamente sua geração. Figura 5 Tipos de capacidade em excesso Gerenciamento da capacidade Nas seções acima definiu-se uma estrutura quadro para quantificar o fornecimento e a demanda de alimentação elétrica e de refrigeração. A estrutura da ITIL especifica as funções utilizadas no processo de gerenciamento de capacidade, como: • Monitoramento do desempenho • Monitoramento da carga de trabalho • Previsões de suprimento • Previsões da demanda APC by Schneider Electric Relatório 150 Revisão 1 10 Gerenciamento da alimentação elétrica e de refrigeração para data centers • Modelagem As ferramentas acima são utilizadas para atingir os objetivos de gerenciamento de capacidade conforme definidos pela ITIL: fornecer previsões de capacidades precisas e fornecer a capacidade adequada para atender às necessidades da empresa. Pode-se prever a utilização de um sistema de gerenciamento da capacidade de alimentação elétrica e de refrigeração baseado em medições realizadas por técnicos, em combinação com cálculos feitos à mão, e de fato, esse método é utilizado em alguns data centers de forma rudimentar. Entretanto, com o advento da virtualização de servidores e de equipamentos de TI que alteram sua própria demanda de alimentação elétrica e refrigeração de forma dinâmica, a única solução prática e possível é o uso de instrumentação em rede para alimentação e refrigeração combinada com um software de gerenciamento de capacidade de alimentação elétrica e de refrigeração. Do ponto de vista do usuário, um sistema desse tipo deveria oferecer as seguintes funcionalidades: • Apresentação dos dados de capacidade; • Planejamento da capacidade • Alertas sobre o descumprimento do plano de capacidade; • Modelagem de mudanças propostas. Apresentação de dados de capacidade As condições atuais de fornecimento e demanda do data center, incluindo as capacidades excedente e imobilizada e outros atributos de capacidade apresentados neste relatório técnico, devem se apresentar em três níveis: • Em toda a sala: fornecimento e demanda globais, bem como as diversas capacidades para toda a sala. Geralmente, concentra-se no nível de no-break, gerador, resfriador, torre de resfriamento e equipamentos de entrada elétrica do estabelecimento. • Por corredor: fornecimento e demanda de alimentação elétrica e de refrigeração associados a cada corredor ou outra área lógica dentro do data center. Costumam estar associados a equipamentos de distribuição de alimentação elétrica ou de refrigeração por corredor, como unidades PDU ou sistemas de refrigeração por corredor. São particularmente úteis para o planejamento quando ainda não se conhecem detalhes por rack sobre a configuração de racks específicos. • Por rack: fornecimento e demanda de alimentação elétrica e de refrigeração associados a um rack ou gabinete específico. É preciso contar com informações nesse nível para diagnosticar problemas ou avaliar o impacto de implementações de equipamentos de TI específicos. Podem estar associados a circuitos de distribuição por rack ou sistemas de refrigeração por rack. Um sistema eficaz de gerenciamento de capacidade permite visualizar os tipos de informações já mencionados em um modelo hierárquico descendente, que inclui uma representação gráfica do leiaute do data center. Na Figura 6 é apresentada a vista de toda a sala e na Figura 7, a vista por rack. APC by Schneider Electric Relatório 150 Revisão 1 11 Gerenciamento da alimentação elétrica e de refrigeração para data centers Figura 6 Exemplo de leiaute de data center com a ferramenta APC Capacity Manager Figura 7 Exemplo de disposição por rack usando a ferramenta APC Capacity Manager APC by Schneider Electric Relatório 150 Revisão 1 12 Gerenciamento da alimentação elétrica e de refrigeração para data centers Planejamento da capacidade É preciso realizar o planejamento da capacidade durante o projeto do data center. Quando instalados no data center, os dispositivos de alimentação elétrica e de refrigeração limitam e, de muitas formas, “se tornam” o lado de fornecimento do plano de capacidade. Atualmente, graças a soluções escaláveis de alimentação elétrica e de refrigeração para data centers, é possível contar com um plano de capacidade adaptável aos planos de expansão de TI a fim de otimizar a eficiência elétrica e as despesas relacionadas com a capacidade. A ITIL foca especificamente o problema de garantir uma capacidade não apenas suficiente mas também adequada. É extremamente frequente que o objetivo seja garantir capacidade suficiente sem se preocupar com o dimensionamento adequado para as necessidades de TI reais. O resultado normal costuma ser o superdimensionamento, gerando custos de capital e contratos de serviço desnecessários e perda de água e energia. Ferramentas para projeto de data centers ajudam a estabelecer planos de capacidade e, portanto, devem ser integradas ao sistema de gerenciamento de capacidade. Um exemplo desse pacote de ferramentas de software é a ferramenta para projeto de data centers InfraStruXure Designer, a plataforma de gerenciamento InfraStruXure Central e a ferramenta Capacity Manager, todas da APC by Schneider Electric. Alertas sobre descumprimentos do plano de capacidade Os alertas relacionados com a capacidade devem ser ativados quando as condições reais estiverem fora dos limites do plano de gerenciamento de capacidade. Essas advertências podem se apresentar como alertas locais, visuais ou sonoros, ou podem passar para níveis mais amplos através do sistema de gerenciamento, como por exemplo, mensagens para pagers, e-mails, etc. Os alarmes de capacidade são gerados como resposta a eventos do tipo: • Aumento do consumo de energia em equipamentos instalados em um rack, ultrapassando o valor máximo especificado no plano de gerenciamento de capacidade para um rack, um corredor ou para toda a sala; • Redução da capacidade de alimentação elétrica ou de refrigeração disponível por rack, por corredor ou em toda a sala devido à perda ou degradação de um subsistema de alimentação elétrica ou de refrigeração; • Sistemas de alimentação elétrica ou de refrigeração entrando em estado no qual não podem oferecer a redundância especificada no plano de gerenciamento de capacidade. Em muitos desses casos, não se produz qualquer falha real de hardware e, portanto, nenhum evento seria ativo por sistemas de monitoramento tradicionais. Na verdade, a maior parte dos alertas de um sistema de gerenciamento de capacidade é de natureza preditiva. Vale mencionar que, em um data center real, o sistema de gerenciamento de capacidade complementa outras ferramentas de monitoramento, como o monitoramento de temperatura, vazamentos de água, segurança e falhas em tempo real. A ferramenta InfraStruXure Central da APC by Schneider Electric é um exemplo de sistema de monitoramento que oferece tanto alertas em tempo real como alertas de gerenciamento de capacidade (Figura 8). APC by Schneider Electric Relatório 150 Revisão 1 13 Gerenciamento da alimentação elétrica e de refrigeração para data centers Figura 8 Exemplo do sistema de monitoramento centralizado APC InfraStruXure Central Modelagem de mudanças propostas. Além de determinar as condições atuais, um sistema eficaz de gerenciamento de capacidade deve poder analisar a capacidade em situações históricas e hipotéticas, entre elas: • Simulação de condições de falha, como perda de um ou mais dispositivos de alimentação elétrica e de refrigeração; • Análise do plano de expansão quanto ao uso real de capacidade; • Propostas de adições, relocações ou eliminações de equipamentos; • Identificação de tendências a partir de dados históricos. O sistema de gerenciamento de capacidade deve permitir a avaliação desses casos em comparação com o plano atual de gerenciamento de capacidade. Um modelo eficaz deve oferecer ao usuário a orientação necessária para selecionar o melhor caso entre as opções oferecidas, por exemplo, para maximizar a eficiência elétrica ou minimizar a utilização de espaço físico. Monitoramento da alimentação elétrica e refrigeração para equipamentos de TI Para a maioria das aplicações, um rack pode ser visto como uma caixa preta que consome energia sem saber a quantidade, o tipo ou a localização dos dispositivos de TI que estão no rack. O sistema de gerenciamento de capacidade apresentado não depende tanto da informação específica de cada dispositivo desde que seja possível especificar ou medir diretamente a energia consumida por rack. Quando o consumo de energia é conhecido, os requisitos de refrigeração podem ser estimados com grande precisão. Quando estes valores por rack estão dentro dos limites estabelecidos pelo plano de capacidade, não são necessárias quaisquer informações adicionais para garantir que os sistemas de alimentação elétrica e de refrigeração possam atender à demanda. Portanto, com as ferramentas certas, APC by Schneider Electric Relatório 150 Revisão 1 14 Gerenciamento da alimentação elétrica e de refrigeração para data centers o gerenciamento de capacidade oferece muitas vantagens para o funcionamento das cargas de TI, sem a necessidade de um gerenciamento detalhado dos equipamentos de TI. Entretanto, é útil ter informações sobre os dispositivos de TI no rack ou poder se comunicar diretamente com os dispositivos de TI. Algumas destas vantagens são: • Conhecimento das características de consumo de energia dos componentes de TI individuais; • Conhecimento das características de energia mínima e máxima variável com o tempo dos dispositivos; • Conhecimento de necessidades incomuns relacionadas com a circulação de ar ou outros modos incomuns de operação dos ventiladores; • Utilização de espaço U por rack (capacidade de espaço); • Possibilidade de oferecer avaliações precisas dos efeitos associados a adições, eliminações ou modificações. Para utilizar o conhecimento obtido do gerenciamento detalhado dos equipamentos de forma eficaz, deve existir um sistema de gerenciamento de capacidade que compreenda esses dados. Em geral, a maioria de data centers pequenos ou de médio porte não têm a maturidade de processos nem a quantidade de pessoal necessário para fazer inventários de instalação de equipamentos de TI relacionados com os racks ou manter históricos de mudanças. Portanto, um sistema de gerenciamento de capacidade não pode depender da existência dessas informações, mas deve ser capaz de aproveitá-las quando estiverem disponíveis. Conforme as organizações crescem, podem passar de um gerenciamento de capacidade simplificado à uma solução mais detalhada que incorpore a gestão de mudanças e de equipamentos. A interação entre a gestão de mudanças e o gerenciamento de capacidade é bidirecional, pois a gestão de mudanças depende em grande medida das informações do gerenciamento de capacidade para prever o impacto das mudanças propostas. Figura 9 Resumo de um sistema de gerenciamento de capacidade APC by Schneider Electric Relatório 150 Revisão 1 15 Gerenciamento da alimentação elétrica e de refrigeração para data centers Conclusão O gerenciamento de capacidade é uma parte essencial do planejamento e do funcionamento eficientes de data centers. A necessidade de contar com um gerenciamento de capacidade cresce conforme crescer a densidade, o tamanho e a complexidade do data center. Apresentamos neste artigo uma metodologia de gerenciamento de capacidade. Foi demonstrado que o gerenciamento de capacidade independe de informações detalhadas sobre os dispositivos de TI por rack e que sua implementação e manutenção requer menos esforços que os tradicionais sistemas de gerenciamento de equipamentos detalhados, ao mesmo tempo em que oferece a maioria de seus benefícios chave. Se o gerenciamento de capacidade for implementado do modo descrito neste relatório técnico, pode oferecer informações fundamentais sobre o estado do data center, não oferecidas por nenhum sistema de monitoramento tradicional. Sobre o autor Neil Rasmussen é Vice-presidente Sênior de Inovação de serviços críticos de energia elétrica e de refrigeração da APC-MGE. Neil define as instruções de tecnologia do maior orçamento de P&D do mundo dedicado à energia elétrica, resfriamento e infra-estrutura de racks para redes críticas. Trabalha atualmente para avançar a ciência de soluções escaláveis de infra-estrutura de alta eficiência e alta densidade para data centers e é o principal criador do sistema InfraStruXure da APC-MGE. Antes de fundar a APC em 1981, Neil recebeu seus diplomas de graduação e de mestrado em engenharia elétrica do MIT onde apresentou sua tese sobre a análise de uma fonte de alimentação de 200 MW para o reator de fusão Tokamak. De 1979 a 1981 trabalhou nos laboratórios Lincoln do MIT em sistemas de armazenamento de energia em volantes de inércia e em sistemas de energia elétrica solar. APC by Schneider Electric Relatório 150 Revisão 1 16 Gerenciamento da alimentação elétrica e de refrigeração para data centers Recursos Projetos de data centers: Modelo de expansão [em inglês] APC Relatório 143 Explore todos os Relatório da C whitepapers.apc.com Explore todas as ferramentas d Off d C tools.apc.com Entre em contato Para incluir comentários sobre o conteúdo deste Relatório: Data Center Science Center, APC by Schneider Electric [email protected] Se você é cliente e tem perguntas relacionadas especificamente com o data center que está projetando Entre em contato com seu representante da APC by Schneider Electric APC by Schneider Electric Relatório 150 Revisão 1 17