Avaliação de Dependabilidade dos Sistemas de Data Centers Erica Sousa Orientador: Paulo Maciel Agenda • Motivação • Objetivos • Metodologia • Arquiteturas dos Sistemas − Modelagem − Resultados • Trabalhos Futuros • Referências 2 05/11/2015 Motivação • O surgimento da cloud computing tem demandado cada vez mais recursos computacionais dos data centers a fim de proporcionar alta disponibilidade aos seus serviços. • Mecanismos que possibilitem que os serviços de cloud alcancem altos níveis de disponibilidade e confiabilidade devem ser empregados como estruturas redundantes e do planejamento da manutenção. • 3 Esse trabalho propõe uma metodologia para avaliação da dependabilidade de sistemas que compõem data centers. 05/11/2015 Objetivos • Estudo de aspectos gerais e particulares dos sistemas que compõem os data centers. • Definição de modelos de redes de Petri estocásticas (SPN) e diagramas de blocos de confiabilidade (RBD) que possibilitem a avaliação de métricas de dependabilidade. 4 05/11/2015 Trabalhos Relacionados • Greenberg et al [2008] aborda sobre o investimento realizado em data centers responsáveis pelos serviços de cloud e maneiras de otimizar esse investimento. • Guo et al [2008] soluciona um desafio em redes de data centers que é encontrar uma maneira de interligar de forma eficiente um número exponencialmente crescente de servidores. • 5 Zou et al [2007] aborda como a disponibilidade da rede pode ser obtida através de algoritmos e de expressões analíticas criadas para diferentes topologias. 05/11/2015 Metodologia 6 05/11/2015 Arquitetura do Sistema • Esse trabalho apresenta cinco arquiteturas de sistemas compostas pelas sistemas energético e de resfriamento. • 7 Essas arquiteturas de sistema são responsáveis pelo fornecimento de energia aos sistemas de resfriamento e de TI. 05/11/2015 Metodologia 8 05/11/2015 Arquitetura do Sistema • 9 Arquitetura 1 05/11/2015 Metodologia 10 05/11/2015 Arquitetura do Sistema Sistema Energético • 11 Arquitetura 1 05/11/2015 Arquitetura do Sistema Sistema de Resfriamento • 12 Arquitetura 1 05/11/2015 Metodologia 13 05/11/2015 Equipamento 14 Modo Operacional 1 2 3 AC Source 1 1 1 1 AC Source 2 1 1 0 Voltage Panel 1 1 1 1 Voltage Panel 2 1 1 1 UPS 1 1 0 1 UPS 2 1 0 1 STS 1 1 1 1 STS 2 1 1 1 Transformer 1 1 1 1 Transformer 2 1 1 1 Transformer 3 1 1 1 Transformer 4 1 1 1 Subpanel 1 1 1 1 Subpanel 2 1 1 1 Junction box 1 1 1 1 Junction box 2 1 1 1 Rack PDU 1 1 1 1 Rack PDU 2 1 1 1 Rack PDU 3 1 1 1 Rack PDU 4 1 1 1 Rack PDU 5 1 1 1 Sistema Energético 1 1 1 05/11/2015 Equipamento 15 Modo Operacional 1 2 3 AC Source 1 1 1 1 AC Source 2 1 1 1 Voltage Panel 1 1 1 1 Voltage Panel 2 1 1 1 Generator 1 1 1 STS 1 1 1 1 STS 2 1 1 1 Cooling Tower 1 1 1 1 Cooling Tower 2 1 1 1 Chiller 1 1 1 1 Chiller 2 1 1 1 Pump 1 1 1 1 Pump 2 1 1 1 Pump 3 1 1 1 Pump 4 1 1 1 CRAC 1 1 0 0 CRAC 2 1 1 0 CRAC 3 1 1 1 CRAC 4 1 0 0 CRAC 5 1 1 1 CRAC 6 1 1 1 1 1 1 05/11/2015 Sistema de Resfriamento Metodologia 16 05/11/2015 Arquitetura • 17 Sistema Energético 05/11/2015 Arquitetura do Sistema • 18 Sistema de Resfriamento 05/11/2015 Metodologia 19 05/11/2015 Arquitetura do Sistema • Sistema Energético 20 05/11/2015 Expressão de Guarda Modo Operacional 1 ((((#RackPDU17_ON=0)OR(#Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransfor mer10_ON=0))OR((#UPS5_ON=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0))OR((# RackPDU17_ON=0)OR(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer 12_ON=0))OR((#UPS6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0)))OR(((#R ackPDU18_ON=0)OR(#Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransformer10 _ON=0))OR((#UPS5_ON=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0))OR((#RackP DU18_ON=0)OR(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer12_ON =0))OR((#UPS6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0)))OR(((#RackPD U19_ON=0)OR(#Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransformer10_ON=0 ))OR((#UPS5_ON=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0))OR((#RackPDU19_ ON=0)OR(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer12_ON=0))O R((#UPS6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0)))OR(((#RackPDU20_O N=0)OR(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer12_ON=0))OR(( #UPS6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0))OR((#RackPDU20_ON=0 )OR(#Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransformer10_ON=0))OR((#UP S5_ON=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0)))OR(((#RackPDU21_ON=0)O R(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer12_ON=0))OR((#UPS 6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0))OR((#RackPDU21_ON=0)OR(# Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransformer10_ON=0))OR((#UPS5_O N=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0)))) 21 November 5, 2015 Arquitetura do Sistema • 22 Sistema de Resfriamento 05/11/2015 Metodologia 23 05/11/2015 Metodologia 24 05/11/2015 Resultados • 25 Arquitetura 1 Sistema Disponibilidade (%) 9’s Downtime Energético 99,6335195 2,4359 32,1037 Resfriamento 98,1296 1,728075 163,843280 05/11/2015 Metodologia 26 05/11/2015 Arquitetura do Sistema • 27 Arquitetura 1 05/11/2015 Metodologia 28 05/11/2015 Resultados • 29 Arquitetura 1 05/11/2015 Disponibilidade (%) 9’s Downtime 97,7700 1,651698 195,3465 Arquitetura do Sistema 30 05/11/2015 Arquitetura do Sistema • 31 Arquitetura 1 05/11/2015 Arquitetura do Sistema • 32 Arquitetura 2 05/11/2015 Arquitetura do Sistema • 33 Arquitetura 3 05/11/2015 Arquitetura do Sistema • 34 Arquitetura 4 05/11/2015 Arquitetura do Sistema • 35 Arquitetura 5 05/11/2015 Dados Equipamento AC Source 4.380 MTTR (Hora) 8 Generator 2.190 8 1.520.000 8 UPS 250.000 8 STS 240.384 8 Transformer 763.201 8 Subpanel 1.520.000 8 Junction Box 26.120.000 8 Rack PDU 22.220.668 4 Cooling Tower 24.816 48 Chiller 18.000 48 CRAC 37.059 8 Pump 31.000 8 VoltagePanel 36 MTTF (Hora) 05/11/2015 Resultados • 37 Sistema Energético Arquitetura Disponibilidade (%) 9’s Downtime 1 99,6335195 2,4359 32,1037 2 99,9996671 5,4777 0,0292 3 99,9999986 7,8648 0,0001 4 99,9916968 4,0808 0,7274 5 99,9996617 5,4707 0,0296 05/11/2015 Resultados • 38 Sistema de Resfriamento 05/11/2015 Disponibilidade (%) 9’s Downtime 98,1296 1,728075 163,843280 Resultados • 39 Arquitetura do Sistema Arquitetura Disponibilidade (%) 9’s Downtime 1 97,7700 1,651698 195,3465 2 98,1293 1,728000 163,8719 3 98,1296 1,728075 163,8434 4 98,1215 1,726188 164,5570 5 98,1293 1,727998 163,8724 05/11/2015 Trabalhos Futuros • Estudo de aspectos gerais e particulares do sistema de TI de data centers. • Definição de modelos de redes de Petri estocásticas (SPN) e diagramas de blocos de confiabilidade (RBD) que possibilitem a avaliação de métricas de desempenho e dependabilidade. • Estudo de modelos de redundância, políticas de manutenção e métricas de interesse. • Concepção de acordos de nível de serviço para data centers. • Escrita de artigos com os resultados alcançados. 40 05/11/2015 Referências • G. Callou, E. Sousa, P. Maciel, E. Tavares, C. Araujo, B. Silva, N. Rosa, F. Magnani, M. Marwah, R. Sharma, A. Shah, T. Christian, J. Pires. Impact Analysis of Maintenance Policies on Data Center Power Infrastructure. IEEE International Conference on Systems, Man, and Cybernetics, Volume 1, Pages 1-8, 2010. • B. Silva, P. Maciel, E. Tavares, C. Araujo, G. Callou, E. Sousa, M. Marwah, R. Sharma, T. Christian, J. Pires. ASTRO: A Tool for Dependability Evaluation of Data Center Infrastructures. IEEE Conference on Systems, Man and Cybernetics, Volume 1, Pages 1-8, 2010. • M. Marwah, P. Maciel, A. Shah, R. Sharma, T. Christian, V. Almeida , C. Araujo, E. Sousa, G. Callou, B. Silva, S. Galdino, J. Pires. Quantifying the Sustainability Impact of Data Center Availability. Sigmetrics/Performance, 2009. 41 05/11/2015 Referências • A. Greenberg, J. Hamilton, D. A. Maltz, P. Patel. The Cost of a Cloud: Research Problems in Data Center Networks. ACM SIGCOMM Computer Communication Review, Volume 39, Number 1, Pages 68-73, 2008. • C. Guo, H. Wu, K. Tan, L. Shi, Y. Zhang, S. Lu. DCell: A Scalable and FaultTolerant Network Structure for Data Centers. ACM SIGCOMM Computer Communication Review, Volume 38, Number 4, Pages 75-86, 2008. • W. Zou, M. Janic, R. Kooij, F. Kuipers. On the availability of networks BroadBand Europe, Pages 3-6, 2007. • D. A. Menasce. Performance and Availability of Internet Data Centers. IEEE Internet Computing, Volume 8, Number 3, Pages 94-96, 2005. 42 05/11/2015