Avaliação de Dependabilidade dos
Sistemas de Data Centers
Erica Sousa
Orientador: Paulo Maciel
Agenda
•
Motivação
•
Objetivos
•
Metodologia
•
Arquiteturas dos Sistemas
− Modelagem
− Resultados
•
Trabalhos Futuros
•
Referências
2
05/11/2015
Motivação
•
O surgimento da cloud computing tem demandado cada
vez mais recursos computacionais dos data centers a fim
de proporcionar alta disponibilidade aos seus serviços.
•
Mecanismos que possibilitem que os serviços de cloud
alcancem altos níveis de disponibilidade e confiabilidade
devem ser empregados como estruturas redundantes e
do planejamento da manutenção.
•
3
Esse trabalho propõe uma metodologia para avaliação da
dependabilidade de sistemas que compõem data centers.
05/11/2015
Objetivos
•
Estudo de aspectos gerais e particulares dos sistemas
que compõem os data centers.
•
Definição de modelos de redes de Petri estocásticas
(SPN) e diagramas de blocos de confiabilidade (RBD)
que possibilitem a avaliação de métricas de
dependabilidade.
4
05/11/2015
Trabalhos Relacionados
•
Greenberg et al [2008] aborda sobre o investimento
realizado em data centers responsáveis pelos serviços de
cloud e maneiras de otimizar esse investimento.
•
Guo et al [2008] soluciona um desafio em redes de data
centers que é encontrar uma maneira de interligar de
forma eficiente um número exponencialmente crescente
de servidores.
•
5
Zou et al [2007] aborda como a disponibilidade da rede
pode ser obtida através de algoritmos e de expressões
analíticas criadas para diferentes topologias.
05/11/2015
Metodologia
6
05/11/2015
Arquitetura do Sistema
•
Esse trabalho apresenta cinco arquiteturas de sistemas
compostas pelas sistemas energético e de resfriamento.
•
7
Essas arquiteturas de sistema são responsáveis pelo
fornecimento de energia aos sistemas de resfriamento e
de TI.
05/11/2015
Metodologia
8
05/11/2015
Arquitetura do Sistema
•
9
Arquitetura 1
05/11/2015
Metodologia
10
05/11/2015
Arquitetura do Sistema
Sistema Energético
•
11
Arquitetura 1
05/11/2015
Arquitetura do Sistema
Sistema de Resfriamento
•
12
Arquitetura 1
05/11/2015
Metodologia
13
05/11/2015
Equipamento
14
Modo Operacional
1
2
3
AC Source 1
1
1
1
AC Source 2
1
1
0
Voltage Panel 1
1
1
1
Voltage Panel 2
1
1
1
UPS 1
1
0
1
UPS 2
1
0
1
STS 1
1
1
1
STS 2
1
1
1
Transformer 1
1
1
1
Transformer 2
1
1
1
Transformer 3
1
1
1
Transformer 4
1
1
1
Subpanel 1
1
1
1
Subpanel 2
1
1
1
Junction box 1
1
1
1
Junction box 2
1
1
1
Rack PDU 1
1
1
1
Rack PDU 2
1
1
1
Rack PDU 3
1
1
1
Rack PDU 4
1
1
1
Rack PDU 5
1
1
1
Sistema Energético
1
1
1
05/11/2015
Equipamento
15
Modo Operacional
1
2
3
AC Source 1
1
1
1
AC Source 2
1
1
1
Voltage Panel 1
1
1
1
Voltage Panel 2
1
1
1
Generator
1
1
1
STS 1
1
1
1
STS 2
1
1
1
Cooling Tower 1
1
1
1
Cooling Tower 2
1
1
1
Chiller 1
1
1
1
Chiller 2
1
1
1
Pump 1
1
1
1
Pump 2
1
1
1
Pump 3
1
1
1
Pump 4
1
1
1
CRAC 1
1
0
0
CRAC 2
1
1
0
CRAC 3
1
1
1
CRAC 4
1
0
0
CRAC 5
1
1
1
CRAC 6
1
1
1
1
1
1
05/11/2015
Sistema de Resfriamento
Metodologia
16
05/11/2015
Arquitetura
•
17
Sistema Energético
05/11/2015
Arquitetura do Sistema
•
18
Sistema de Resfriamento
05/11/2015
Metodologia
19
05/11/2015
Arquitetura do Sistema
•
Sistema
Energético
20
05/11/2015
Expressão de Guarda
Modo Operacional 1
((((#RackPDU17_ON=0)OR(#Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransfor
mer10_ON=0))OR((#UPS5_ON=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0))OR((#
RackPDU17_ON=0)OR(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer
12_ON=0))OR((#UPS6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0)))OR(((#R
ackPDU18_ON=0)OR(#Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransformer10
_ON=0))OR((#UPS5_ON=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0))OR((#RackP
DU18_ON=0)OR(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer12_ON
=0))OR((#UPS6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0)))OR(((#RackPD
U19_ON=0)OR(#Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransformer10_ON=0
))OR((#UPS5_ON=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0))OR((#RackPDU19_
ON=0)OR(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer12_ON=0))O
R((#UPS6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0)))OR(((#RackPDU20_O
N=0)OR(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer12_ON=0))OR((
#UPS6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0))OR((#RackPDU20_ON=0
)OR(#Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransformer10_ON=0))OR((#UP
S5_ON=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0)))OR(((#RackPDU21_ON=0)O
R(#Junction_Box16_ON=0)OR(#Subpanel14_ON=0)OR((#SDTransformer11_ON=0)AND(#SDTransformer12_ON=0))OR((#UPS
6_ON=0)AND(#StaticTransferSwitch8_ON=0))OR(#Subpanel4_ON=0)OR(#AC_Source2_ON=0))OR((#RackPDU21_ON=0)OR(#
Junction_Box15_ON=0)OR(#Subpanel13_ON=0)OR((#SDTransformer9_ON=0)AND(#SDTransformer10_ON=0))OR((#UPS5_O
N=0)AND(#StaticTransferSwitch7_ON=0))OR(#Subpanel3_ON=0)OR(#AC_Source1_ON=0))))
21
November 5,
2015
Arquitetura do Sistema
•
22
Sistema de Resfriamento
05/11/2015
Metodologia
23
05/11/2015
Metodologia
24
05/11/2015
Resultados
•
25
Arquitetura 1
Sistema
Disponibilidade
(%)
9’s
Downtime
Energético
99,6335195
2,4359
32,1037
Resfriamento
98,1296
1,728075
163,843280
05/11/2015
Metodologia
26
05/11/2015
Arquitetura do Sistema
•
27
Arquitetura 1
05/11/2015
Metodologia
28
05/11/2015
Resultados
•
29
Arquitetura 1
05/11/2015
Disponibilidade
(%)
9’s
Downtime
97,7700
1,651698
195,3465
Arquitetura do Sistema
30
05/11/2015
Arquitetura do Sistema
•
31
Arquitetura 1
05/11/2015
Arquitetura do Sistema
•
32
Arquitetura 2
05/11/2015
Arquitetura do Sistema
•
33
Arquitetura 3
05/11/2015
Arquitetura do Sistema
•
34
Arquitetura 4
05/11/2015
Arquitetura do Sistema
•
35
Arquitetura 5
05/11/2015
Dados
Equipamento
AC Source
4.380
MTTR (Hora)
8
Generator
2.190
8
1.520.000
8
UPS
250.000
8
STS
240.384
8
Transformer
763.201
8
Subpanel
1.520.000
8
Junction Box
26.120.000
8
Rack PDU
22.220.668
4
Cooling Tower
24.816
48
Chiller
18.000
48
CRAC
37.059
8
Pump
31.000
8
VoltagePanel
36
MTTF (Hora)
05/11/2015
Resultados
•
37
Sistema Energético
Arquitetura
Disponibilidade
(%)
9’s
Downtime
1
99,6335195
2,4359
32,1037
2
99,9996671
5,4777
0,0292
3
99,9999986
7,8648
0,0001
4
99,9916968
4,0808
0,7274
5
99,9996617
5,4707
0,0296
05/11/2015
Resultados
•
38
Sistema de Resfriamento
05/11/2015
Disponibilidade
(%)
9’s
Downtime
98,1296
1,728075
163,843280
Resultados
•
39
Arquitetura do Sistema
Arquitetura
Disponibilidade
(%)
9’s
Downtime
1
97,7700
1,651698
195,3465
2
98,1293
1,728000
163,8719
3
98,1296
1,728075
163,8434
4
98,1215
1,726188
164,5570
5
98,1293
1,727998
163,8724
05/11/2015
Trabalhos Futuros
•
Estudo de aspectos gerais e particulares do sistema de TI de
data centers.
•
Definição de modelos de redes de Petri estocásticas (SPN) e
diagramas de blocos de confiabilidade (RBD) que possibilitem
a avaliação de métricas de desempenho e dependabilidade.
•
Estudo de modelos de redundância, políticas de manutenção
e métricas de interesse.
•
Concepção de acordos de nível de serviço para data centers.
•
Escrita de artigos com os resultados alcançados.
40
05/11/2015
Referências
•
G. Callou, E. Sousa, P. Maciel, E. Tavares, C. Araujo, B. Silva, N. Rosa, F.
Magnani, M. Marwah, R. Sharma, A. Shah, T. Christian, J. Pires. Impact
Analysis of Maintenance Policies on Data Center Power Infrastructure. IEEE
International Conference on Systems, Man, and Cybernetics, Volume 1,
Pages 1-8, 2010.
•
B. Silva, P. Maciel, E. Tavares, C. Araujo, G. Callou, E. Sousa, M. Marwah,
R. Sharma, T. Christian, J. Pires. ASTRO: A Tool for Dependability
Evaluation of Data Center Infrastructures. IEEE Conference on Systems,
Man and Cybernetics, Volume 1, Pages 1-8, 2010.
•
M. Marwah, P. Maciel, A. Shah, R. Sharma, T. Christian, V. Almeida , C.
Araujo, E. Sousa, G. Callou, B. Silva, S. Galdino, J. Pires. Quantifying the
Sustainability Impact of Data Center Availability. Sigmetrics/Performance,
2009.
41
05/11/2015
Referências
•
A. Greenberg, J. Hamilton, D. A. Maltz, P. Patel. The Cost of a Cloud:
Research Problems in Data Center Networks. ACM SIGCOMM Computer
Communication Review, Volume 39, Number 1, Pages 68-73, 2008.
•
C. Guo, H. Wu, K. Tan, L. Shi, Y. Zhang, S. Lu. DCell: A Scalable and FaultTolerant Network Structure for Data Centers. ACM SIGCOMM Computer
Communication Review, Volume 38, Number 4, Pages 75-86, 2008.
•
W. Zou, M. Janic, R. Kooij, F. Kuipers. On the availability of networks
BroadBand Europe, Pages 3-6, 2007.
•
D. A. Menasce. Performance and Availability of Internet Data Centers. IEEE
Internet Computing, Volume 8, Number 3, Pages 94-96, 2005.
42
05/11/2015
Download

Data Centers - MoDCS Research Group