Avaliação de Sistemas Críticos ­ Lista II Prof.: Paulo Maciel Prazo: 08/12 às 23:59 Aleciano Ferreira Lobo Júnior ­ [email protected] Charles Bezerra Moreira ­ [email protected] Carlos Alexandre Silva de Melo ­ [email protected] Edson Samuel Gonzaga da Silva Júnior ­ [email protected] 1. For database server system composed by two servers (S1 and S2) operating in hot standby sparing configuration, a storage device (D) and controller (C) – see Figure 1. The system fails if D or C or either server fails. Consider that the constant failure rates are λS1 = λS2 = 0.00002, λc = 0.00001, λD1 = 0.00008. Figure 1: database server system a) Identify the failure mode and write down the respective logical function. O modo operacional de falha para esta circunstância pode ser representado através de uma função lógica pela qual o sistema apresenta seu comportamento. Neste caso, a função lógica para este sistema de servidor de banco de dados corresponde a: ψ(bs) = D1 ⋃ C ⋃ (S1 ⋂ S 2) b) Write down the structure function. Em se tratando de árvore de falhas, a função estrutural considera ψ(y(t)) = 1 como uma falha ocorrendo. Então: ψ(y(t)) = [1 − (1 − yD1 (t)) ∙ (1 − yC (t)) ∙ (1 − yS1 (t) ∙ yS2 (t))] c) Design the respective FT. d) Write down the expression for the R(t). R(t) = (e−λD1t ∙ e−λCt ) ∙ (1 − (1 − e−λ t )n ) e) Write down the expression for the MTTF. λ = λS2 = λS Assumindo S1
∞
M T T F = ∫ R(t)dt ∞
0
M T T F = ∫ (e−λD1t ∙ e−λCt ) ∙ 1 − (1 − e−λSt )n dt 0
f) Calculate MTTF of system using SHARPE and compare the result with that obtained expression in e). Utilizando a ferramenta SHARPE: Obtendo através da fórmula: g) Draw the reliability curve in the interval [0, 1460h) using SHARPE and the expression obtained in d). 2. Consider a system in which software applications read, write and modify the content of the storage device D1 (source). The system periodically replicates the production data (generated by the software application) of one storage device (D1) in storage system. The storage system is composed by three storage devices (D2, D3, D4), arranged in TMR configuration. Such a control is performed by the storage system controller (C) ­ see Figure 2. The system is considered to have failed if the hardware infrastructure does not allow the software applications to read, write or modify data on D1, and if no safe data replica is available, that is two out of three data replica are safely stored on the storage system. Consider that the constant failure rates are λS = 0.00002, λC = 0.00001, λD1 = 0.00008, and λD2 = λD3 = λD4 0.00009, respectively. Figure 2: Data Consistent System a) Identify the operational mode and write down the logical function.
φ(D1, S erver, C , D2, D3, D4) = D1 ⋂ S erver ⋂ C ⋂ (D2_D3_D4 2/3)
b) Write down the structure function. ø(D1, S erver, C , D2, D3, D4) = D1 ∙ S erver ∙ C ∙ (D2_D3_D4 2/3) c) Design the respective RBD. d) Write down the expression for the R(t). e) Write down the expression for the MTTF. ∞
M T T F = ∫ R(t)dt ∞
M TTF = ∫
0
e−λD1t
∙ e−λSt
∙ e−λCt
∙ 3 ∙ e−2λ t dt −
∞
∫ e−λ
D1t
∙ e−λSt ∙ e−λCt ∙ 2 ∙ e−3λt dt 0
0
f) Calculate MTTF of system using Mercury and compare the result with that obtained expression in e). Utilizando o Mercury MTTF: 5081.66969147003 De forma manual: ∞
MTTF = ∫
e−λD1t
∙
e−λSt
∙
e−λCt
∙3∙
0
e−2λ t
∞
− ∫ e−λD1t ∙ e−λSt ∙ e−λCt ∙ 2 ∙ e−3λt 0
M T T F = 10344.8 − 5263.16 M T T F = 5081.64 g) Draw the reliability curve in the interval [0, 1460h) using Mercury and the expression obtained in d). 3. For computer system composed by two servers (server sub­system: S1 and S2) operating in hot standby sparing configuration, a storage sub­system (D1 and D2) configured in RAID 1 and controller (C) – see Figure 3. The system fails if server sub­system or storage sub­system or C fails. Consider that the constant failure rates are λS1 = 1.14155 × 10−4 h−1 , λS2 = 7.61035 × 10−5 h−1, λC = 5.70776 × 10−5 h−1 , λD1 = λD2 = 8 × 10−5 h−1. The respective time to repair are exponentially distributed with rate μS1 = μS2 = 20.833 × 103 h−1, μD1 = μD2 = 10.417 × 103 h−1 and μC = 41.667 × 103 h−1. Figure 3: computer system a) Identify the operational mode and write down the respective logical function. φ(D1, D2, C , S 1, S 2) = (D1 ⋃ D2) ⋂ C ⋂ (S1 ⋃ S 2) b) Propose a RBD model of the server sub­system and compute its availability. Availability: 1.0 c) Conceive an availability model of the whole system. d) Compute the steady state availability of the system. Utilizando o Mercury: ************ Steady­state Results ************ Availability: 0.9999999931506209 Number of 9's: 8.164348800861385 e) Calculate the respective system’s downtime in minutes per year. Downtime: 0.003602422466536198 minutes f) Conceive a reliability model of the whole system. g) Calculate system’s MTTF. Utilizando o Mercury: ************ Steady­state Results ************ MTTF: 7257.604608730004 h) Draw the reliability curve in the interval [0, 1460h). 4. Consider a two­component parallel­redundant system with distinct failure rates λ1 and λ2, respectively. Upon failure of a component, a repair process is invoked with the respective repair rates μ1 and μ2. Assume that a failure of a component while another is being repaired causes a system failure. a) Derive the reliability and the MTTF of the system. Rprs (t) = e−λ1t + e−λ2t − e−(λ1+λ2)t M T T F prs =
1
λ1
1
+ λ1 − λ +λ
2
1
2
b) Derive the r steady­state availability of the system and the downtime. n
MT T F
Aprs = 1 − ∏ 1 − ( MT T F +MTi T R ), n = 2 i=1
i
i
DT prs = (1 − Aprs )t 5. Comment about the following subjects a) Warm standby sparing Esse tipo de redundância em paralelo é um meio­termo entre a hot standby e a cold standby. Se temos duas máquinas em paralelo, na warm standby as duas máquinas está ligadas, mas somente uma recebe carga operacional. A máquina redundante apesar de ligada, não tem todos os recursos ativos, necessitando de um tempo t para levantá­los e se tornar operacional. Pelo fato de ter menos componentes ativos enquanto está em standby, considera­se que a confiabilidade do sistema seja maior que a da redundância hot standby. b) Hot standby sparing Na redundância hot standby tem­se duas máquinas em paralelo, ligadas, mas só uma recebe carga. A outra máquina está pronta, com recursos ativos e pode ser disponibilizada imediatamente para servir assim que detectada a falha na primeira máquina. A confiabilidade do sistema é menor que a redundância warm standby, pois com mais recursos ativos, considera­se que a máquina secundária tem mais chances de falhar. c) Cold standby sparing Este tipo de redundância se caracteriza por ter duas máquinas em paralelo, mas só um está ligada e recebendo a carga. A segunda máquina está desligada. Assim que detectada a falha na máquina principal, a segunda é ligada. A questão é que se necessita de um tempo considerável até que esta máquina esteja disponível e operacional. A confiabilidade deste tipo de redundância é a maior de todas as outras citadas, considerando­se o mesmo tipo de componentes, pois, estando a segunda máquina desligada, ela não falha (considerando­se que qualquer componente só falha quando está ligado).0 d) Active­Active redundancy Na redundância ativo­ativo há uma divisão na carga recebida pelo sistema, como todas as máquinas devem estar ligadas e em funcionamento, o risco de se deparar com defeitos acaba sendo maior. e) RAID 5, RAID 1, RAID 50, RAID 51 RAID 1: Replica os mesmos dados de um disco para o outro, se caracteriza por manter os dados com uma maior margem de segurança, em compensação reduz a capacidade pela metade. RAID 5: Divide a paridade em fragmentos e a distribui entre todos os discos, uma das principais características do RAID 5 é que ele permite a falha de um disco. RAID 50: Subdivide o grupo de discos em dois, cada grupo poderá perde um dos seus discos, já que a paridade continuará distribuída entre os discos deste grupo. A vantagem é uma maior segurança e uma maior rapidez no acesso aos dados, em contrapartida a capacidade de armazenamento será reduzida. RAID 51: Assim como o 50 subdivide os discos em dois grupos, cada grupo com a sua paridade distribuída internamente, porém a capacidade de armazenamento aqui será drasticamente reduzida, já que ambos os grupos armazenarão os mesmos dados de forma espelhada, a maior vantagem de utilizar este tipo de RAID está em permitir que não apenas um disco no grupo entre estado defeituoso, mas que um grupo inteiro possa ser removido sem que os dados sejam perdidos. f) Combinational models and shared repairing Modelos combinacionais representam as relações estruturais entre componentes de um sistema (e seus sub­componentes) que fazem o sistema funcionar ou estar em falha. 6. ​
Considere um sistema composto por uma unidade de disco e um servidor. Especificações do Servidor Especificações da unidade de disco Placa­​
mãe (MB) Controlador (SAN C) Memória (M) Raid 50 (6 discos no total) Controlador de disco (HDC) Hard disk (HD) Controlador de rede (NC) Fonte dual ­ hot standby (S1, S2) Pede­​
se: a) MTTF geral MTTF: 1709.416020380358 b)​
R(10000h) MTTF’s MB = 30000h M = 20000h HDC = 25000h HD = 10000h NC = 15000h S1/S2 = 5000h SAN C = 35000h HD.RAID = 10000h c)​
Gráfico de b) 7. MTTR SAN C = 48h MTTR HD.RAID = 48h MTTR Sj = 36h MTTR i = 24h ­​
∀i, i != SAN C, HD.RAID, Sj a) Calcule a disponibilidade estacionária (A) Availability: 0.9913078645404073 b) Calcule o downtime (DT) anual em minutos ou horas, conforme seja mais conveniente Uptime: 8689.619137989734 hours Downtime: 76.1936320102674 hours 8. ​
MTTF’s: ­ SO = 4000h ­ VMi = 4000h ­ HP = 8000h ­ DBMS = 6000h ­ AP = 3000h ­ SW = 8h Calcular: a) Disponibilidade estacionária do sistema ­ A(hw e sw) Availability: 0.9804347393204855 b) Downtime do sistema ­ DT(hw e sw) Downtime: 171.03651798806143 hours 9. O sistema de SW provido pela infraestrutura corresponde a um sistema de vendas online. Considere que esse sistema é adotado por uma pequena rede de farmácias. A figura apresenta uma visão dessa arquitetura. Considere que o número de transações que chegam ao servidor do serviço é 1 TPM (transações por minuto). O tempo entre transações é distribuído exponencialmente. O tempo médio necessário para processar 1 transação é 2s (ST). Este tempo é exponencialmente distribuído. O sistema suporta até 20 solicitações (execução de transações) simultaneamente. Cada transação gera um lucro líquido (L) de R$1,00. O modelo de desempenho é a SPN seguinte: Vazão = P {#P1 > 0} x 1 / ST Vazão=0.4999999999999 a) Quantas transações são perdidas mensalmente devido ao downtime? NTP = Vazão x DT mensal NTP= 0.4999999 * (171.03651798806143 / 12) NTP = 7.1265215828357503862350099488083 b) Qual o prejuízo mensal devido à perda causada pelo downtime? P = NTP x L P = 7.1265215828357503862350099488083 * 1.00 P = R$ 7.13 
Download

tempo t para