Especialização em Segurança da Informação Segurança no Armazenamento 1. Introdução Márcio Aurélio Ribeiro Moreira [email protected] http://si.lopesgazzani.com.br/docentes/marcio/ Objetivos da unidade Explicitar a necessidade de armazenamento Avaliar as alternativas de solução Revisar os principais conceitos de armazenamento Explorar os tipos de RAID Mostrar as alternativas de redes de armazenamento Márcio Moreira 1. Introdução – Slide 2 Segurança no Armazenamento de Informações O armazenamento não está resolvido? O número total de livros produzidos desde o começo da imprensa não passa de 1 bilhão: Se cada livro tiver em média 500 páginas com 2000 caracteres cada. Logo, 1 MB é suficiente para armazenar cada livro sem compressão Para armazenar todos os livros precisamos de 1 bilhão de MB ou 1 PetaByte (PB) Considerando Us$20 / GB, 1 PB pode ser comprado por Us$20 milhões Márcio Moreira 1. Introdução – Slide 3 Segurança no Armazenamento de Informações O armazenamento nas organizações Banco da Índia (2007): 14.000 filiais em todo o país 11.000 escritórios conectados ao Data Center Mais de 20 milhões de clientes ≈ 100 TB armazenados Crescimento exponencial Questões de segurança: Compressão / Cifragem Antivírus Firewall e IDS Fonte: Ramakrishnan Márcio Moreira 1. Introdução – Slide 4 Segurança no Armazenamento de Informações Demanda de performance e espaço Demanda Espaço 8X Demanda Performance 300% 7X 253% 250% 6X Demanda anual de 50% de espaço e performance 4X 7.6X 75% 2.3X 1X 50% 1.5X Hoje 1 Ano 2 anos 1. Introdução – Slide 5 3.4X 3 anos 150% 100% 5.1X 2X Márcio Moreira 169% 113% 3X 1X 200% 50% 4 anos 5 anos Fonte: Ramakrishnan 5X Segurança no Armazenamento de Informações Alternativas para a demanda Podemos resolver com RAMs? Caras e voláteis só para processamento Podemos utilizar fitas? Baratas e lentas por serem seqüenciais backups Podemos resolver com CDs e DVDs? Baratos e aleatórios. Mas, lentos distribuição Podemos resolver com HDs? Preço justo, aleatórios e rápidos muitos HDs Onde colocar tantos HDs? Fora do gabinete Márcio Moreira 1. Introdução – Slide 6 Segurança no Armazenamento de Informações Camadas de dados Computadores Notebooks Camada web Camada Aplicações Camada de Banco de Dados Pessoas e Coisas Dispositivos Fonte: Ramakrishnan Márcio Moreira Camada de Storage 1. Introdução – Slide 7 Segurança no Armazenamento de Informações 1º dispositivo magnético A superfície do disco (ou fita) é coberta com uma substância magnética Movimento mecânico posiciona cabeça do dispositivo para: Gravação: definir a polarização. Leitura: testar a polarização Por ser magnética, a polarização é mantida mesmo sem energia Márcio Moreira 1. Introdução – Slide 8 Segurança no Armazenamento de Informações Armazenamento em discos Organiza os dados em áreas endereçáveis Devem ser formatados para serem endereçáveis pelos sistemas operacionais O acesso direto provê performance adequada para acessos seqüencial ou randômico O desempenho do disco é impactado pelo tempo de posicionamento da cabeça para o acesso Os discos são conectados fisicamente ao sistema: É inviável movê-los para um novo local ou novo sistema Como conectar vários discos num mesmo sistema? Márcio Moreira 1. Introdução – Slide 9 Segurança no Armazenamento de Informações Vamos olhar os discos de perto Márcio Moreira 1. Introdução – Slide 10 Segurança no Armazenamento de Informações Formatação para acesso direto Trilha Cada prato do disco é segmentado em vários anéis concêntricos chamados trilhas Cilindro Um cilindro é o conjunto formato por uma trilha específica em todos os pratos juntas Setor Fonte: EMC Márcio Moreira Um setor é a menor parte endereçável de uma trilha O endereço único de uma área em um drive de disco é composto de: Cilindro, Cabeça e Setor. 1. Introdução – Slide 11 Segurança no Armazenamento de Informações Tempo de acesso ao drive de disco Seek Time: Tempo de busca Média de tempo gasto para mover o braço do atuador para a posição de leitura ou gravação da cabeça na trilha Normalmente, informado em milissegundos (ms) Fonte: EMC Márcio Moreira 1. Introdução – Slide 12 Segurança no Armazenamento de Informações Tempo de acesso ao drive de disco Latency: Tempo de Latência ou tempo de espera racional Média de tempo gasto para esperar o disco girar e o setor desejado chegar o início da posição de acesso Tempo de meia volta: 50% * 1 / RPM / 60 * 1000 Fonte: EMC Márcio Moreira 1. Introdução – Slide 13 Segurança no Armazenamento de Informações Tempo de acesso ao drive de disco Transfer Rate: Taxa de Transferência Média de tempo gasto para ler (ou escrever) e enviar (ou receber) os dados do setor para o drive de disco (MB) Tempo de Transferência: Kbytes / (taxa * 1024) * 1000 (ms) Fonte: EMC Márcio Moreira 1. Introdução – Slide 14 Segurança no Armazenamento de Informações Variáveis da performance de discos Tempo de Busca (TB) Tempo de Latência (TL): Velocidade rotação RPM RPM Tempo de Latência RPM tem menor impacto na Taxa de Transferência TL = 50% * 1 / RPM / 60 * 1000 (ms) Taxa de Transferência (TT): Ultra SCSI: 40 MB/sec Canal de fibra: 100 MB/sec TT = Kb / (taxa * 1024) * 1000 (ms) Tempo de Resposta (TR): Fonte: EMC Márcio Moreira TR = TB + TL + TT 1. Introdução – Slide 15 Segurança no Armazenamento de Informações Evolução da tecnologia de discos A capacidade continua aumentando muito com o aumento da densidade dos dados A performance aumenta marginalmente com: Aumento da velocidade de rotação (RPM) Aumento do uso da memória e cache no nível de drive As interfaces são dirigidas por padrões da indústria: ATA (Advanced Technology Attachment) Ultra SCSI (Small Computer System Interface) Canal de Fibra Desafios da indústria: Aumentar a capacidade por disco reduzindo custo. Mas, … Reduzir o número de atuadores mantendo a capacidade Fonte: EMC Márcio Moreira 1. Introdução – Slide 16 Segurança no Armazenamento de Informações Necessidades de armazenamento 100% High-End Us$40/GB Alta Performance Tempo Crítico 99.999% Midrange Us$20/GB 99.9% SATA Us$5/GB Longo Prazo Tape Us$0.5/GB Demanda do negócio Custo Crítico Alta Capacidade Fonte: Ramakrishnan Márcio Moreira 1. Introdução – Slide 17 Segurança no Armazenamento de Informações Tecnologia RAID Como obter performance e confiabilidade? RAID: Redundant Array of Independent Disks Um conjunto de HDs é visto pelo SO como uma única unidade de disco Vantagens: Grande capacidade de armazenamento Acesso paralelo melhor performance Permite o espelhamento de dados Desvantagens: Custo: requer hardware ou software especial Se espelhado: requer o dobro de espaço Márcio Moreira 1. Introdução – Slide 18 Segurança no Armazenamento de Informações Conexões físicas dos discos Variáveis para conexões físicas: Tipos de cabos Número de vias Conectores físicos Regras para conexões lógicas: Identificar os comandos (de leitura e gravação) e os dados HBA Formato do drive: Esquema de endereçamento Sistema ROM controlador ou (Read Only Memory) placa de circuito: CPU ESCON para mainframe Host Bus Adapter (placas para fibra ótica) para sistemas abertos Placas proprietárias para o AS/400 Márcio Moreira System Bus 1. Introdução – Slide 19 MAIN MEMORY (RAM) Fonte: EMC Segurança no Armazenamento de Informações Como a operação de I/O ocorre HBA Iniciando uma requisição de leitura: ROM (Read Only Memory) System Bus CPU MAIN MEMORY (RAM) Fonte: EMC Márcio Moreira 1. Introdução – Slide 20 Segurança no Armazenamento de Informações Como a operação de I/O ocorre HBA Completando a requisição de leitura: ROM (Read Only Memory) System Bus CPU MAIN MEMORY (RAM) Fonte: EMC Márcio Moreira 1. Introdução – Slide 21 Segurança no Armazenamento de Informações Usando melhor a CPU e a memória “Vamos ver”: ROM Cache Read ahead (Read Only Memory) Customer 1 Meter Reading Customer 3 Meter Reading Márcio Moreira System Bus CPU 1. Introdução – Slide 22 MAIN MEMORY (RAM) CACHE Técnica: HBA Acessamos o cliente 1 Depois o cliente 2 Qual será o próximo? Presumo o cliente 3 Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading Customer 2 Meter Reading Fonte: EMC Segurança no Armazenamento de Informações Melhorando ainda mais Usar controladora no RAID: ROM (Read Only Memory) CACHE CPU HBA Libera processamento Libera memória RAM Customer 3 Meter Reading Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading System Bus CPU Customer 1 Meter Reading MAIN MEMORY (RAM) Customer 2 Meter Reading Fonte: EMC Márcio Moreira 1. Introdução – Slide 23 Segurança no Armazenamento de Informações Como a operação de I/O ocorre HBA Iniciando um comando de escrita: ROM (Read Only Memory) System Bus CPU MAIN MEMORY (RAM) Fonte: EMC Márcio Moreira 1. Introdução – Slide 24 Segurança no Armazenamento de Informações Como a operação de I/O ocorre HBA Completando o comando de escrita: ROM (Read Only Memory) System Bus CPU MAIN MEMORY (RAM) Fonte: EMC Márcio Moreira 1. Introdução – Slide 25 Segurança no Armazenamento de Informações Melhor uso da CPU e memória ROM (Read Only Memory) CACHE CPU HBA A confirmação de escrita é emitida assim que os dados e o comando de gravação estão seguros dentro de uma área completamente tolerante à falha Comando de escrita: “Grave a conta mensal do cliente no disco”. Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading System Bus CPU MAIN MEMORY (RAM) Fonte: EMC Márcio Moreira 1. Introdução – Slide 26 Segurança no Armazenamento de Informações Por dentro dos Disk Arrays Host Interface Host Interface Fault Tolerant Cache Memory Gaveta do sistema operacional Array Controller Array Controller Disk Directors Disk Directors Gavetas de discos Fonte: EMC Márcio Moreira 1. Introdução – Slide 27 Segurança no Armazenamento de Informações RAID 0 - Striping ou Fracionamento Os dados são divididos em segmentos e estes são colocados nos HDs Não há redundância Sem RAID: 3 HDs num mesmo host. Cada HD contem um volume Com RAID 0: Os volumes são divididos em blocos e movidos para balancear a carga de atividades. Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 End Volume 2 End Volume 3 End Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Volume 2 Middle Volume 3 Middle Volume 1 Middle Volume 3 End Volume 1 End Volume 2 End Fonte: EMC Márcio Moreira 1. Introdução – Slide 28 Segurança no Armazenamento de Informações RAID 1 - Mirroring ou Espelhamento Os dados de um HD são espelhados em outro gerando redundância Sem RAID: 3 HDs num mesmo host. Com RAID 1: Um espelho de cada HD é criado gerando um para de HDs. Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 End Volume 2 End Volume 3 End Volume 1 Beginning Volume 1 Beginning Volume 2 Beginning Volume 2 Beginning Volume 3 Beginning Volume 3 Beginning Volume 1 Middle Volume 1 Middle Volume 2 Middle Volume 2 Middle Volume 3 Middle Volume 3 Middle Volume 1 End Volume 1 End Volume 2 End Volume 2 End Volume 3 End Volume 3 End Fonte: EMC Márcio Moreira 1. Introdução – Slide 29 Segurança no Armazenamento de Informações RAID 1+0 - Performance e Redundância Os HDs (volumes físicos) são espelhados e os volumes lógicos divididos Sem RAID: 3 HDs num mesmo host. Com RAID 1+0: HDs espelhados. Volumes lógicos fracionados para balancear carga. Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 End Volume 2 End Volume 3 End Volume 1 Beginning Volume 1 Beginning Volume 2 Beginning Volume 2 Beginning Volume 3 Beginning Volume 3 Beginning Volume 2 Middle Volume 2 Middle Volume 3 Middle Volume 3 Middle Volume 1 Middle Volume 1 Middle Volume 3 End Volume 3 End Volume 1 End Volume 1 End Volume 2 End Volume 2 End Fonte: EMC Márcio Moreira 1. Introdução – Slide 30 Segurança no Armazenamento de Informações Paridade de dados A paridade é utilizada para tentar recuperar dados perdidos Group 1 Group 2 Group 3 0 1 1 Parity for 1st Group = 0 Parity for 2nd Group = 1 0 1 0 1 1 Parity for 3rd Group = 1 LOST DATA DATA + DATA + DATA = Parity Fonte: EMC Márcio Moreira Group 1 0 + 1 + 1 = 0 Group 2 0 + 1 + 0 = 1 Group 3 1 + 1 + ? = 1 1. Introdução – Slide 31 Segurança no Armazenamento de Informações RAID 5 - Fracionamento e paridade Divide os dados no nível de bloco e acrescenta um bloco de paridade Requer no mínimo 3 discos Sem RAID: 3 HDs num mesmo host. Com RAID 5: Um grupo de drives são agrupados como um volume físico. Fonte: EMC Márcio Moreira Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 End Volume 2 End Volume 3 End Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Parity for 3rd Group Parity for 2nd Group Volume 3 Middle Volume 2 Middle Volume 1 Middle Volume 3 End Volume 1 End Parity for 1st Group Volume 2 End 1. Introdução – Slide 32 Segurança no Armazenamento de Informações Níveis de RAID Nível Mínimo Discos Técnica Aplicação Comentários 0 Fracionamento em blocos 2 Alta performance Sem redundância 1 Espelhamento 2 Alta disponibilidade e performance Implantação simples 2 Fracionamento em bits Monitoramento em RAM 2 Alta performance e disponibilidade Nenhum uso comercial 3 Fracionamento em bytes Disco de paridade 3 Alta performance e disponibilidade Menor custo 4 Fracionamento em blocos (Múltiplos I/O) Disco de paridade 3 Processamento de transações Alta disponibilidade Alta taxa de leitura Baixo uso comercial 5 Fracionamento em blocos (Múltiplos I/O) Discos de paridade independentes 3 Processamento de transações Alta disponibilidade Alta taxa de leitura 6 Fracionamento em blocos (Múltiplos I/O) Múltiplos discos de paridade independentes 4 Processamento de transações Alta disponibilidade Alta taxa de leitura Baixo uso comercial Níveis mais usados comercialmente: 0, 1, 3, 5 e 10 (1+0): Múltiplos I/O Independência de leitura e gravação (acesso múltiplo). Custo comparado para níveis que oferecem mesmos benefícios. Fonte: EMC, IBM, Wikipedia e experiência. Márcio Moreira 1. Introdução – Slide 33 Segurança no Armazenamento de Informações Arquiteturas típicas de storage DAS: Direct Attached Storage NAS: Netware Windows NT/2K Linux/Unix Direct Attached Storage (DAS) Network Attached Storage Netware SAN: Storage Area Network Windows NT/2K Linux/Unix NAS Network Attached Storage (NAS) Storage Windows NT/2K FC Switch Netware Linux/Unix Márcio Moreira 1. Introdução – Slide 34 Storage Area Network (SAN) Segurança no Armazenamento de Informações Conexões típicas (Read Only Memory) NIC HBA ROM Tape Drive Device System Bus HBA Network Router Storage Array HBA SAN Switch CPU MAIN MEMORY (RAM) Márcio Moreira 1. Introdução – Slide 35 Segurança no Armazenamento de Informações Produtos de Storage da EMC Symmetrix CLARiiON CX700 NS700/G Centera Centera DL700 ADIC Scalar Series CX500 CX300 DMX3000-M2 DMX3000 DMX2000-M2 DMX2000 DMX1000-M2 DMX1000 DMX800 Celerra CNS Netwin 110 SAN / NAS / Backupto-Disk SAN / NAS Márcio Moreira AX 100 1. Introdução – Slide 36 CAS Tape & Tape Emulation Segurança no Armazenamento de Informações Referências EMC. Storage Basics. EMC. Jun-2006. S. Ramakrishnan. Management of large scale Terabyte Store information servers. IACITS 2007. Jul-2007. Khattar, Murphy, Tarella e Nystrom. Introduction to Storage Area Network, SAN. IBM. Redbooks. SG24-5470-00. 1999. Márcio Moreira 1. Introdução – Slide 37 Segurança no Armazenamento de Informações