Especialização
em Segurança
da Informação
Segurança no Armazenamento
1. Introdução
Márcio Aurélio Ribeiro Moreira
[email protected]
http://si.lopesgazzani.com.br/docentes/marcio/
Objetivos da unidade
Explicitar a necessidade de armazenamento
Avaliar as alternativas de solução
Revisar os principais conceitos de
armazenamento
Explorar os tipos de RAID
Mostrar as alternativas de redes de
armazenamento
Márcio Moreira
1. Introdução – Slide 2
Segurança no Armazenamento de Informações
O armazenamento não está resolvido?
O número total de livros produzidos desde o
começo da imprensa não passa de 1 bilhão:
Se cada livro tiver em média 500 páginas com
2000 caracteres cada. Logo, 1 MB é suficiente
para armazenar cada livro sem compressão
Para armazenar todos os livros precisamos
de 1 bilhão de MB ou 1 PetaByte (PB)
Considerando Us$20 / GB, 1 PB pode ser
comprado por Us$20 milhões
Márcio Moreira
1. Introdução – Slide 3
Segurança no Armazenamento de Informações
O armazenamento nas organizações
Banco da Índia (2007):
14.000 filiais em todo o país
11.000 escritórios conectados ao Data Center
Mais de 20 milhões de clientes
≈ 100 TB armazenados
Crescimento exponencial
Questões de segurança:
Compressão / Cifragem
Antivírus
Firewall e IDS
Fonte: Ramakrishnan
Márcio Moreira
1. Introdução – Slide 4
Segurança no Armazenamento de Informações
Demanda de performance e espaço
Demanda
Espaço
8X
Demanda
Performance
300%
7X
253%
250%
6X
Demanda anual de
50% de espaço e
performance
4X
7.6X
75%
2.3X
1X
50%
1.5X
Hoje
1 Ano
2 anos
1. Introdução – Slide 5
3.4X
3 anos
150%
100%
5.1X
2X
Márcio Moreira
169%
113%
3X
1X
200%
50%
4 anos
5 anos
Fonte: Ramakrishnan
5X
Segurança no Armazenamento de Informações
Alternativas para a demanda
Podemos resolver com RAMs?
Caras e voláteis  só para processamento
Podemos utilizar fitas?
Baratas e lentas por serem seqüenciais  backups
Podemos resolver com CDs e DVDs?
Baratos e aleatórios. Mas, lentos  distribuição
Podemos resolver com HDs?
Preço justo, aleatórios e rápidos  muitos HDs
Onde colocar tantos HDs? Fora do gabinete
Márcio Moreira
1. Introdução – Slide 6
Segurança no Armazenamento de Informações
Camadas de dados
Computadores
Notebooks
Camada
web
Camada
Aplicações
Camada de
Banco de Dados
Pessoas e
Coisas
Dispositivos
Fonte: Ramakrishnan
Márcio Moreira
Camada de Storage
1. Introdução – Slide 7
Segurança no Armazenamento de Informações
1º dispositivo magnético
 A superfície do disco (ou fita) é coberta com uma substância magnética
 Movimento mecânico posiciona cabeça do dispositivo para:
 Gravação: definir a polarização. Leitura: testar a polarização
 Por ser magnética, a polarização é mantida mesmo sem energia
Márcio Moreira
1. Introdução – Slide 8
Segurança no Armazenamento de Informações
Armazenamento em discos
 Organiza os dados em áreas endereçáveis
 Devem ser formatados para serem endereçáveis
pelos sistemas operacionais
 O acesso direto provê performance adequada para
acessos seqüencial ou randômico
 O desempenho do disco é impactado pelo tempo
de posicionamento da cabeça para o acesso
 Os discos são conectados fisicamente ao sistema:
 É inviável movê-los para um novo local ou novo sistema
 Como conectar vários discos num mesmo sistema?
Márcio Moreira
1. Introdução – Slide 9
Segurança no Armazenamento de Informações
Vamos olhar os discos de perto
Márcio Moreira
1. Introdução – Slide 10
Segurança no Armazenamento de Informações
Formatação para acesso direto
Trilha
Cada prato do disco é segmentado em
vários anéis concêntricos chamados trilhas
Cilindro
Um cilindro é o conjunto formato por uma
trilha específica em todos os pratos juntas
Setor
Fonte: EMC
Márcio Moreira
Um setor é a menor parte endereçável de
uma trilha
O endereço único de uma área em um drive de
disco é composto de: Cilindro, Cabeça e Setor.
1. Introdução – Slide 11
Segurança no Armazenamento de Informações
Tempo de acesso ao drive de disco
Seek Time:
Tempo de busca
Média de tempo gasto
para mover o braço do
atuador para a posição
de leitura ou gravação da
cabeça na trilha
Normalmente, informado
em milissegundos (ms)
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 12
Segurança no Armazenamento de Informações
Tempo de acesso ao drive de disco
Latency:
Tempo de Latência ou
tempo de espera racional
Média de tempo gasto
para esperar o disco girar
e o setor desejado chegar
o início da posição de
acesso
Tempo de meia volta:
50% * 1 / RPM / 60 * 1000
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 13
Segurança no Armazenamento de Informações
Tempo de acesso ao drive de disco
Transfer Rate:
Taxa de Transferência
Média de tempo gasto
para ler (ou escrever) e
enviar (ou receber) os
dados do setor para o
drive de disco (MB)
Tempo de Transferência:
Kbytes / (taxa * 1024) *
1000 (ms)
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 14
Segurança no Armazenamento de Informações
Variáveis da performance de discos
 Tempo de Busca (TB)
 Tempo de Latência (TL):
 Velocidade rotação RPM
  RPM   Tempo de Latência
  RPM tem menor impacto na Taxa de
Transferência
 TL = 50% * 1 / RPM / 60 * 1000 (ms)
 Taxa de Transferência (TT):
 Ultra SCSI:
40 MB/sec
 Canal de fibra: 100 MB/sec
 TT = Kb / (taxa * 1024) * 1000 (ms)
 Tempo de Resposta (TR):

Fonte: EMC
Márcio Moreira
TR = TB + TL + TT
1. Introdução – Slide 15
Segurança no Armazenamento de Informações
Evolução da tecnologia de discos
 A capacidade continua aumentando muito
com o aumento da densidade dos dados
 A performance aumenta marginalmente com:
 Aumento da velocidade de rotação (RPM)
 Aumento do uso da memória e cache no nível de drive
 As interfaces são dirigidas por padrões da
indústria:
 ATA (Advanced Technology Attachment)
 Ultra SCSI (Small Computer System Interface)
 Canal de Fibra
 Desafios da indústria:
 Aumentar a capacidade por disco reduzindo custo. Mas, …
 Reduzir o número de atuadores mantendo a capacidade
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 16
Segurança no Armazenamento de Informações
Necessidades de armazenamento
100%
High-End
Us$40/GB
Alta
Performance
Tempo Crítico
99.999%
Midrange
Us$20/GB
99.9%
SATA
Us$5/GB
Longo Prazo
Tape
Us$0.5/GB
Demanda do
negócio
Custo Crítico
Alta
Capacidade
Fonte: Ramakrishnan
Márcio Moreira
1. Introdução – Slide 17
Segurança no Armazenamento de Informações
Tecnologia RAID
 Como obter performance e confiabilidade?
 RAID:
Redundant Array of Independent Disks
Um conjunto de HDs é visto pelo SO como uma única unidade
de disco
 Vantagens:
Grande capacidade de armazenamento
Acesso paralelo  melhor performance
Permite o espelhamento de dados
 Desvantagens:
Custo: requer hardware ou software especial
Se espelhado: requer o dobro de espaço
Márcio Moreira
1. Introdução – Slide 18
Segurança no Armazenamento de Informações
Conexões físicas dos discos
 Variáveis para conexões físicas:
 Tipos de cabos
 Número de vias
 Conectores físicos
 Regras para conexões lógicas:
 Identificar os comandos (de leitura e
gravação) e os dados
HBA
 Formato do drive:
 Esquema de endereçamento
 Sistema
ROM
controlador ou
(Read Only Memory)
placa de circuito:
CPU
 ESCON para mainframe
 Host Bus Adapter (placas para fibra
ótica) para sistemas abertos
 Placas proprietárias para o AS/400
Márcio Moreira
System Bus
1. Introdução – Slide 19
MAIN MEMORY
(RAM)
Fonte: EMC
Segurança no Armazenamento de Informações
Como a operação de I/O ocorre
HBA
Iniciando uma requisição de leitura:
ROM
(Read Only Memory)
System Bus
CPU
MAIN MEMORY
(RAM)
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 20
Segurança no Armazenamento de Informações
Como a operação de I/O ocorre
HBA
Completando a requisição de leitura:
ROM
(Read Only Memory)
System Bus
CPU
MAIN MEMORY
(RAM)
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 21
Segurança no Armazenamento de Informações
Usando melhor a CPU e a memória
“Vamos ver”:
ROM
Cache
Read ahead
(Read Only Memory)
Customer 1
Meter Reading
Customer 3
Meter Reading
Márcio Moreira
System Bus
CPU
1. Introdução – Slide 22
MAIN MEMORY
(RAM)
CACHE
Técnica:
HBA
Acessamos o cliente 1
Depois o cliente 2
Qual será o próximo?
Presumo o cliente 3
Customer 1
Meter Reading
Customer 2
Meter Reading
Customer 3
Meter Reading
Customer 2
Meter Reading
Fonte: EMC
Segurança no Armazenamento de Informações
Melhorando ainda mais
Usar controladora no RAID:
ROM
(Read Only Memory)
CACHE
CPU
HBA
Libera processamento
Libera memória RAM
Customer 3
Meter Reading
Customer 1
Meter Reading
Customer 2
Meter Reading
Customer 3
Meter Reading
System Bus
CPU
Customer 1
Meter Reading
MAIN MEMORY
(RAM)
Customer 2
Meter Reading
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 23
Segurança no Armazenamento de Informações
Como a operação de I/O ocorre
HBA
Iniciando um comando de escrita:
ROM
(Read Only Memory)
System Bus
CPU
MAIN MEMORY
(RAM)
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 24
Segurança no Armazenamento de Informações
Como a operação de I/O ocorre
HBA
Completando o comando de escrita:
ROM
(Read Only Memory)
System Bus
CPU
MAIN MEMORY
(RAM)
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 25
Segurança no Armazenamento de Informações
Melhor uso da CPU e memória
ROM
(Read Only Memory)
CACHE
CPU
HBA
A confirmação de escrita
é emitida assim que os dados
e o comando de gravação estão
seguros dentro de uma área
completamente tolerante à
falha
Comando de escrita:
“Grave a conta mensal
do cliente no disco”.
Customer 1
Meter Reading
Customer 2
Meter Reading
Customer 3
Meter Reading
System Bus
CPU
MAIN MEMORY
(RAM)
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 26
Segurança no Armazenamento de Informações
Por dentro dos Disk Arrays
Host Interface
Host Interface
Fault Tolerant
Cache Memory
Gaveta do sistema
operacional
Array Controller
Array Controller
Disk Directors
Disk Directors
Gavetas de discos
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 27
Segurança no Armazenamento de Informações
RAID 0 - Striping ou Fracionamento
 Os dados são divididos em segmentos e estes são colocados nos HDs
 Não há redundância
Sem RAID:
3 HDs num mesmo host.
Cada HD contem um volume
Com RAID 0:
Os volumes são divididos
em blocos e movidos para
balancear a carga de
atividades.
Volume 1
Beginning
Volume 2
Beginning
Volume 3
Beginning
Volume 1
Middle
Volume 2
Middle
Volume 3
Middle
Volume 1
End
Volume 2
End
Volume 3
End
Volume 1
Beginning
Volume 2
Beginning
Volume 3
Beginning
Volume 2
Middle
Volume 3
Middle
Volume 1
Middle
Volume 3
End
Volume 1
End
Volume 2
End
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 28
Segurança no Armazenamento de Informações
RAID 1 - Mirroring ou Espelhamento
 Os dados de um HD são espelhados em outro gerando redundância
Sem RAID:
3 HDs num
mesmo host.
Com RAID 1:
Um espelho de
cada HD é
criado gerando
um para de HDs.
Volume 1
Beginning
Volume 2
Beginning
Volume 3
Beginning
Volume 1
Middle
Volume 2
Middle
Volume 3
Middle
Volume 1
End
Volume 2
End
Volume 3
End
Volume 1
Beginning
Volume 1
Beginning
Volume 2
Beginning
Volume 2
Beginning
Volume 3
Beginning
Volume 3
Beginning
Volume 1
Middle
Volume 1
Middle
Volume 2
Middle
Volume 2
Middle
Volume 3
Middle
Volume 3
Middle
Volume 1
End
Volume 1
End
Volume 2
End
Volume 2
End
Volume 3
End
Volume 3
End
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 29
Segurança no Armazenamento de Informações
RAID 1+0 - Performance e Redundância
 Os HDs (volumes físicos) são espelhados e os volumes lógicos divididos
Sem RAID:
3 HDs num
mesmo host.
Com RAID 1+0:
HDs espelhados.
Volumes lógicos
fracionados para
balancear carga.
Volume 1
Beginning
Volume 2
Beginning
Volume 3
Beginning
Volume 1
Middle
Volume 2
Middle
Volume 3
Middle
Volume 1
End
Volume 2
End
Volume 3
End
Volume 1
Beginning
Volume 1
Beginning
Volume 2
Beginning
Volume 2
Beginning
Volume 3
Beginning
Volume 3
Beginning
Volume 2
Middle
Volume 2
Middle
Volume 3
Middle
Volume 3
Middle
Volume 1
Middle
Volume 1
Middle
Volume 3
End
Volume 3
End
Volume 1
End
Volume 1
End
Volume 2
End
Volume 2
End
Fonte: EMC
Márcio Moreira
1. Introdução – Slide 30
Segurança no Armazenamento de Informações
Paridade de dados
 A paridade é utilizada para tentar recuperar dados perdidos
Group 1
Group 2
Group 3
0
1
1
Parity for 1st
Group = 0
Parity for 2nd
Group = 1
0
1
0
1
1
Parity for 3rd
Group = 1
LOST DATA
DATA + DATA + DATA = Parity
Fonte: EMC
Márcio Moreira
Group 1
0
+
1 +
1
= 0
Group 2
0
+
1 +
0
= 1
Group 3
1
+
1 +
?
= 1
1. Introdução – Slide 31
Segurança no Armazenamento de Informações
RAID 5 - Fracionamento e paridade
 Divide os dados no nível de bloco e acrescenta um bloco de paridade
 Requer no mínimo 3 discos
Sem RAID:
3 HDs num
mesmo host.
Com RAID 5:
Um grupo de
drives são
agrupados como
um volume físico.
Fonte: EMC
Márcio Moreira
Volume 1
Beginning
Volume 2
Beginning
Volume 3
Beginning
Volume 1
Middle
Volume 2
Middle
Volume 3
Middle
Volume 1
End
Volume 2
End
Volume 3
End
Volume 1
Beginning
Volume 2
Beginning
Volume 3
Beginning
Parity for
3rd Group
Parity for
2nd Group
Volume 3
Middle
Volume 2
Middle
Volume 1
Middle
Volume 3
End
Volume 1
End
Parity for
1st Group
Volume 2
End
1. Introdução – Slide 32
Segurança no Armazenamento de Informações
Níveis de RAID
Nível
Mínimo
Discos
Técnica
Aplicação
Comentários
0
Fracionamento em blocos
2
Alta performance
Sem redundância
1
Espelhamento
2
Alta disponibilidade e performance
Implantação simples
2
Fracionamento em bits
Monitoramento em RAM
2
Alta performance e disponibilidade
Nenhum uso comercial
3
Fracionamento em bytes
Disco de paridade
3
Alta performance e disponibilidade
Menor custo
4
Fracionamento em blocos (Múltiplos I/O)
Disco de paridade
3
Processamento de transações
Alta disponibilidade
Alta taxa de leitura
Baixo uso comercial
5
Fracionamento em blocos (Múltiplos I/O)
Discos de paridade independentes
3
Processamento de transações
Alta disponibilidade
Alta taxa de leitura
6
Fracionamento em blocos (Múltiplos I/O)
Múltiplos discos de paridade independentes
4
Processamento de transações
Alta disponibilidade
Alta taxa de leitura
Baixo uso comercial
 Níveis mais usados comercialmente: 0, 1, 3, 5 e 10 (1+0):
 Múltiplos I/O  Independência de leitura e gravação (acesso múltiplo).
 Custo comparado para níveis que oferecem mesmos benefícios.
Fonte: EMC, IBM, Wikipedia e experiência.
Márcio Moreira
1. Introdução – Slide 33
Segurança no Armazenamento de Informações
Arquiteturas típicas de storage
DAS:
Direct Attached Storage
NAS:
Netware
Windows NT/2K
Linux/Unix
Direct Attached Storage (DAS)
Network Attached Storage
Netware
SAN:
Storage Area Network
Windows NT/2K
Linux/Unix
NAS
Network Attached Storage (NAS)
Storage
Windows NT/2K
FC Switch
Netware
Linux/Unix
Márcio Moreira
1. Introdução – Slide 34
Storage Area
Network (SAN)
Segurança no Armazenamento de Informações
Conexões típicas
(Read Only Memory)
NIC
HBA
ROM
Tape Drive Device
System Bus
HBA
Network
Router
Storage Array
HBA
SAN
Switch
CPU
MAIN MEMORY
(RAM)
Márcio Moreira
1. Introdução – Slide 35
Segurança no Armazenamento de Informações
Produtos de Storage da EMC
Symmetrix
CLARiiON
CX700 NS700/G
Centera
Centera
DL700
ADIC
Scalar
Series
CX500
CX300
DMX3000-M2
DMX3000
DMX2000-M2
DMX2000
DMX1000-M2
DMX1000
DMX800
Celerra
CNS
Netwin 110
SAN / NAS /
Backupto-Disk
SAN / NAS
Márcio Moreira
AX 100
1. Introdução – Slide 36
CAS
Tape &
Tape
Emulation
Segurança no Armazenamento de Informações
Referências
 EMC. Storage Basics. EMC. Jun-2006.
 S. Ramakrishnan. Management of large scale Terabyte
Store information servers. IACITS 2007. Jul-2007.
 Khattar, Murphy, Tarella e Nystrom. Introduction to Storage
Area Network, SAN. IBM. Redbooks. SG24-5470-00. 1999.
Márcio Moreira
1. Introdução – Slide 37
Segurança no Armazenamento de Informações
Download

1. Introdução