Interfaces • • • • As – – – Interfaces são escolhidas baseadas na: Velocidade (capacidade em transferir os dados) Distancia (qual a distância que ela pode transferir os dados) Robustez (Posso interromper a transmissão e depois restaurar? Como posso adicionar novos dispositivos com o sistema “ligado”?) – Tamanho do endereçamento (Quantos dispositivos posso conectar?) – Custo (Quanto tudo isso me custa) Dois tipos comuns de interfaces, são a serial e paralela Serial baixo custo de implementação, geralmente suportam distancias elevadas • Mouse, modem, USB, rede local – Paralela alto custo, porem, com altas taxas de Transferência • Impressora, SCSI O processamento avançado dos sinais analógicos estão incentivando cada vez mais performance tanto nas interfaces seriais como paralela Largura de Banda: A Rede Local vs. Conexão de Storage Ano 1992 1994 1996 1998 1999 2003 Rede 0.1 MB 1 MB 10 MB 100 MB* 200 MB** 1000MB*** Storage 10 MB 20 MB 40 MB 100 MB 160 MB 320 MB Diferença 100-to-1 20-to-1 4-to-1 1-to-1 .8 to 1 .33 to 1 *O Gigabit Ethernet pode utilizar técnicas como “trunking” para aumentar e agregar largura de banda **O Fibre channel proporciona hoje 200 MBS embora o 400 MBS seja eminente ***10-Gigabit Ethernet está atualmente em desenvolvimento NAS ou SAN? Clientes Rede em modo genérico LAN/WAN/FDDI Servidores Heterogêneos Storage Area Network (SAN) Controladoras Array Com Discos NAS ou SAN? Clientes Rede em modo genérico LAN/WAN/FDDI Servidor Unix De Grande Porte Servidor Unix Servidor NT Servidor NT Thin Server otimizado apenas para acesso a arquivos, não precisa de: - Monitor - Teclado Servidor de Arquivos - Arquivos CIF - Arquivos NFS Network Attach Storage (NAS) NAS ou SAN? Portanto qual a diferença? (1) A Conecção – SAN utiliza Fibre Channel – NAS utiliza redes TCP/IP Networks: Ethernet, FDDI, ATM (possivelmente algum dia TCP/IP sobre Fibre Channel) (2) Os Protocolos – SAN utiliza SCSI encapsulado – NAS utiliza Protocolos de File Server: NFS, CIFS, HTTP A Diferença (2) É a mais Importante SAN é caro para o segmento Entry Level e Mid Range Item NAS SAN Comentário Preço de entrada da tecnologia Começa abaixo de $3,000 >$10,000 O menor NAS é um simples disco rígido conectado a uma porta Ethernet (DASD)t, O menor SAN necessita Fibre HBA, Cabeamento Fibre , SAN software, Discos em Fibre Infra Estrutura Utiliza a mesma estrutura de Rede Necessita de Infra Estrutura de Fibre channel O Investimento Necessário em Fibre channel HBA’s e Cabeamento Fibre Channel = $750 por nó vs. Ethernet $150 por nó. Software Não necessita, utilizar os protocolos nativos Necessita de um ‘SAN OS” instalado em cada cliente Adicione $$$ para o software de SAN Periféricos de Storage Usa periféricos padrão SCSI, entretanto a sua expansão é limitada se comparamos com a SAN Geralmente requer conecção direta Fibre para cada periférico Discos Fibre custam no mínimo 30% a mais dos o mesmo disco em SCSI, Fibre bridges (SCSI<>Fibre) continuam ao redor de $1,000 por nó Gerenciamento Geralmente utiliza SNMP e DNS (Serviços existentes na rede) para gerenciamento e suporte Requer da mesma forma um software de gerenciamento específico, treinamento especializado e arquitetura Fibre Channel Adicione $$$ pelo SAN software, Adicione $$ e tempo para treinamento pessoal. Detalhes sobre o Armazenamento em disco com RAID Conceitos de RAID • Um simples Disco Rígido físico ou multiplos discos em um gabite externo sem funcionabilidades RAID é geralmente chamado de – JBOD (Just A Bunch Of Disks) – SAS (Server Attached Storage) podendo estar dentro do servidor. • O projeto e pesquisa RAID foi desenvolvido pela Universidade de Berkley (CA-USA) nos anos 80. – Tema Original = Redundant Array of Independant Disks – Atualmente = Redundant Array of Inexpensive Disks • RAID combina um número independente de discos juntos proporcionando aumento do throughput/performance no acesso e confiabilidade dos dados – Níveis RAID diferentes proporcionam uma variedade de misturas de performance e tolerância a falhas Aplicações RAID • Aplicações com Alta Taxa de Transferência (Ambientes tipicamente RAID 0) • RAID striping é o ideal para aplicações com intensa transferência de dados – Aplicações que necessitam de uma grande quantidade de dados a ser processada em um intervalo de tempo pré-definido – Streaming Media • Video on demand, Digital Cable, Transmissões ao vivo – A taxa de dados fixa é critica, Transmissões múltiplas não devem degradar a qualidade “QoS” = Quality of Service – Stream contínuo de dados – sem espaço para o reenvio • Processamento de Imagem, manipulação e Renderização • Aplicações com alto índice de solicitações de informação (ambiente típico para o RAID 5) • RAID é utilizado para aplicações de alto uso de multitasking, alta taxa de retorno de informação • OLTP = On Line Transaction Processing (aplicações típicas) – Validação de cartão de crédito, Reservas, ECommerce, Gerenciamento de estoque on-line – Banco dados e aplicações Web based – Alto número de transações randômicas Um Overview da Tecnologia RAID • O que é RAID? – Dois ou mais discos rígidos independentes. – Aparece no servidor como um único Grande Disco Rígido . – Sistema Operacional totalmente independente. – Dispositivo com alta confiabilidade e redundância. • Aumento da Disponibilidade dos Dados – Rápido acesso aos dados (multiple drives). – Segurança oferecida pela redundância/paridade. • Gerenciamento Simplificado – Partição de um único Drive para gerenciamento/partição. • Componentes Hot-Swap – Tanto para um ou vários drives. – Fontes de Alimentação e Ventilação, também. • O que RAID não é – Suporte a aplicações de Disaster Recovery Físicos (Tape Drivers). RAID Level 0 0123, 4567, 8901, 2345, 6789, 1234, 5678, 9012, 3456, 7890, 0001, 0002, 0003, 0004, 0005, 0006 Data Stream RAID Level 0: Disk Striping 0123 (1) 4567 (2 ) 8901(3) 2345 (4 ) 6789 (5) 1234 (6 ) 5678 (7) 9012 (8 ) 3456 (9) 7890 (10 ) 0001 (11) 0002 (12 ) 0003 (13) 0004 (14 ) 0005 (15) 0006 (16 ) Disk 1 Disk 2 Disk 3 Disk 4 Block order shown in parentheses RAID Level O provides high performance through disk stiping Níveis Raid RAID Level 0 - Striping • Uso de múltiplos Discos para a formação de um único Disco lógico. • Performance na implementação do RAID • Alta performance na Escrita e Leitura (Write and Read) performance relacionada com o aumento da quantidade de Discos. • Os Discos Rígidos são distribuídos utilizando-se uma tamanho definido de “stripe” durante a configuração – Deve ser otimizado em conjunto com o Sistema Operacional para uma performance otimizada • As pequenas solicitações que possuem o mesmo tamanho de “stripe” são transmitidas a um único Disco Rígido, as solicitações maiores são divididas e transmitidas a múltiplos Discos Rígidos em paralelo • A capacidade é a soma do número de discos no “array” • Não proporciona proteção contra falhas de hardware, somente performance. Resumo Nível: RAID 0 • RAID-0, “Striping”, todos os Discos estão disponíveis para dados, Inseguro. • Utilizado para armazenamento temporário • Qualquer Disco que falhar causa a perda dos dados 10 = Total de Discos 10 = Capacidade Usável 0 = Redundância de Discos 10 = Performance Leitura 10 = Performance Escrita Dados Todos os Dados Foram Perdidos RAID Level 1 0123, 4567, 8901, 2345 Data Stream RAID Level 1: Disk Mirroring 0123 (1) 0123 (1 1) 4567 (2) 4567 (2 1) 8901 (3) 8901 (3 1) 2345 (4) 2345 (4 1) Disk 1 Copy of Disk 1 Block order shown in parentheses RAID Level 1 provides fully redundant disk mirroring Níveis Raid RAID Level 1 - Espelhamento • O RAID 1 proporciona alto nível de tolerância a falhas – Cada solicitação de I/O é espelhada em um segundo Disco Rígido • O RAID 1 trabalha com múltiplos de dois Discos Rígidos- o set primário e o set espelhado – dobrando também o custo por GB da solução – Proporciona o mesmo throughput durante a escrita – Oferece mais performance durante a leitura (read) – A controladora RAID executa o mesmo comando de leitura em cada Disco – assim que um dos discos disponibiliza os dados, ele é automaticamente transferido para o servidor e o próximo comando de leitura pode ser processado. • Oferece proteção contra falhas nos discos com taxa de 1 para 1 – Assim que um disco falha, automaticamente o espelho assume, porém caso ocorra a falha no espelho não existe mais segurança – Pode proteger contra desastre naturais/físicos porém o espelho deve estar instalado remotamente (em outro local físico) acarretando em um custo adicional $$. – Não protege contra vírus digital ou acidentes/delete intencional, já que 100% do disco está sincronizado com o outro • Implementação de Alto Custo – Controladora RAID + – Custo por GB de chega a ser o dobro se compararmos com uma unidade simples. Resumo Nível: RAID 1 • RAID-1, “Mirroring” rápido, 50% dos Discos estão disponíveis para dados, extremamente seguro. • Utilizados para informações importantes • Qualquer Disco espelhado pode falhar, e os dados permanecem salvos Data Copy 2 = Total de Discos 1 = Capacidade Usável 1 = Redundância de Discos 2 = Performance Leitura 1 = Performance Escrita Os dados permanecem Salvos -----------------------Todos os Dados Foram Perdidos RAID Level 3 0123, 4567, 8901, 2345 Data Stream RAID Level 3: Dedicated Parity Parallel Access 0 1 2 3 6 4 5 6 7 22 8 9 0 1 18 2 3 4 5 14 Data Disk 1 Data Disk 2 Data Disk 3 Data Disk 4 Parity Disk Byte level striping shown here RAID Level 3 uses separate parity disk Paridade e ECC • Utiliza metodologia de reconstrução dos dados perdidos, adicionandose informações adicionais, comumente chamada de “overhead” • Utiliza cálculos Matemáticos Polinomiais e operações inversas • È utilizada uma equação de 5th Grau para encontrar a soma e o resultado. (5+10+?+2+7 = 27) – O método de detecção de erros com paridade em computadores Bit funciona apenas para a detecção do erro. Error Método de Paridade no barramento SCSI Binary 128 64 32 16 8 4 2 1 Parity Bit Number 2 0 0 0 0 0 0 1 0 0 1 6 0 0 0 0 0 1 1 0 1 3 33 0 0 1 0 0 0 0 0 1 2 33 0 0 1 0 0 0 0 1 1 3 Number Parity Sum Error Parity Níveis Raid RAID Level 3 – Acesso Sincronizado com disco dedicado de paridade • O Uso de mais Discos possibilita um aumento do throughput – Um único de Disco de paridade pode ser um problema de gargalo na performance • Proteção contra falha de Disco com razão de 1 para vários – A Performance é degradada durante o acesso, e especificamente durante a reconstrução em caso de falha (rebuild) de um disco rígido (demorando horas) – Não oferece proteção contra desastre físicos – Não protege contra vírus digital ou acidentes/delete intencional, já que os dados são protegidos por um esquema de paridade ECC (com esquema e atualização em tempo real) • Implementação de Alto Custo – Custo da Controladora RAID + – Discos Rígidos com sincronização de spindle – 1 Disco Rígido adicional para Paridade – Implementado como um sistema RAID (gabinete stand alone) RAID Level 5 0123, 4567, 8901, 2345, 6789, 1234, 5678, 9012, 3456, 7890, 0001, 0002, 0003, 0004, 0005, 0006 Data Stream RAID Level 5: Distributed Parity Independent Access 0123 (1) 4567 (2 ) 8901(3) 2345 (4 ) 15936 (P) 6789 (5) 1234 (6 ) 5678 (7) 22713 (P) 9012 (8 ) 3456 (9) 7890 (10 ) 11349 (P) 0001 (11 ) 0002 (12 ) 0003 (13) 0018 (P) 0004 (14) 0005 (15 ) 0006 (16 ) Disk 1 Disk 2 Disk 3 Disk 4 Disk 5 Block order shown in parentheses (P) = Calculated parity value RAID Level 5 distributes parity across all drives Níveis Raid RAID Level 5 – Acesso Independente com paridade distribuída • • • O uso de mais discos possibilita o aumento da performance RAID 5, é geralmente utilizado em ambientes OLTP Proteção contra falha de Disco com razão de 1 para vários – Qualquer disco rígido (1) pode falhar e mesmo assim o sistema permanece intacto – Não oferece proteção contra desastre físicos – Não protege contra vírus digital ou acidentes/delete intencional, já que os dados são protegidos por um esquema de paridade ECC (com esquema e atualização em tempo real) Implementação de Alto Custo – Capacidade com perda pela Paridade, o crescimento dos dados aumenta o custo por GB – Custo da Controladora RAID + – Implementado como um sistema RAID (gabinete stand alone) Resumo Nível: RAID 5 • RAID-5, rápido, todos menos um disco está disponível para dados, Segurança. • Utilizado com Armazenamento Primário • Caso um Disco falhe ”OK”, O segundo Disco ocasiona a perda total dos dados! 10 = Total de Discos 8 = Capacidade Usável 1 = Redundância de Disco 8 = Performance Leitura 8 = Performance Escrita Data Paridade Os dados permanecem Salvos -----------------------Todos os Dados Foram Perdidos Hot Spare RAID Level 0+1 0123, 4567, 8901, 2345, 6789, 1234, 5678, 9012, 3456, 7890, 0001, 0002, 0003, 0004, 0005, 0006 Data Stream RAID Level 0+1: Striped Mirrored Array 0123 (1) 4567 (2 ) 8901(3) 2345 (4 ) 6789 (5) 1234 (6 ) 5678 (7) 9012 (8 ) 3456 (9) 7890 (10 ) 0001 (11) 0002 (12 ) 0003 (13) 0004 (14 ) 0005 (15) 0006 (16 ) Disk 1 Disk 2 Disk 3 Disk 4 0123 (1 1) 4567 (2 1) 8901(3 1) 2345 (4 1) 6789 (5 1) 1234 (6 1) 5678 (7 1) 9012 (8 1) 3456 (9 1) 7890 (10 1) 0001 (11 1) 0002 (12 1) 0003 (13 1) 0004 (14 1) 0005 (15 1) 0006 (16 1) Copy of Disk 1 Copy of Disk 2 Copy of Disk 3 Block order shown in parentheses RAID Level 0+1 combines data striping and disk mirroring Copy of Disk 4 Combinação de níveis RAID • RAID 00, 10, 30, 50 • Múltiplos níveis RAID 0, 1, 3, ou 5 Arrays podem ser “striped” entre eles para a criação dos níveis RAID 00, 10, 30 ou 50 – Proporciona mais capacidade – Freqüentemente chamado de composição RAID • Proporciona um melhor “load balancing”. Interface da Aplicação RAID 0 Stripping RAID 1 RAID 1 RAID 1 ARRAY ARRAY ARRAY Resumo Nível: RAID 0+1 • • • O RAID-10, é extremamente rápido, metade dos Discos estão disponíveis para Disco/ dobro do Preço, Seguro. Usado para dados primários e críticos Caso um Disco falhe ”OK”, O segundo ocasiona a perda dos dados! Os dados permanecem Salvos -----------------------Todos os Dados Foram Perdidos Data Grupo #1 Dados Críticos Grupo #2 Espelho (Cópia) 20 = Total de Discos 10 = Capacidade Usável *2 = Redundância de Discos 20 = Performance Leitura 10 = Performance Escrita Resumo Nível: RAID 5+1 RAID 5+1 oferece 4 discos de capacidade porém com necessidade total de 10 discos: Dados Paridade Grupo #1 Dados Críticos Grupo #2 Espelho (Cópia) Striping Paridade Os dados permanecem Salvos ------------------------ Todos os Dados Foram Perdidos Introduzindo o RAIDn • • A INOSTOR detê a patente de um inovador algorítimo RAID, que incorpora um novo conceito em nível RAID, este novo algorítimo é chamado de RAIDn RAIDn pode ser implementado tanto em software como em hardware – Inicialmente o RAIDn está desenvolvido como um pacote de software • • Comparando-se com as tecnologias RAID tradicionais, RAIDn oferece maior confiabilidade e melhor utilização do disco ao mesmo custo A INOSTOR utilizará a tecnologia RAIDn em seus próprios sistemas de storage, entretanto ela também estará disponível via licenciamento para outras empresas que tiverem interesse. Porque RAIDn • • • • • • • Nova tecnologia que proporciona proteção superior a ambientes de missão crítica quando comparados com os produtos RAID atuais. Segurança contra falhas de múltiplos Discos, ideal para aplicações de missão crítica. Melhor confiabilidade, baixo custo, alta performance. Exemplo: Mesma Capacidade, Maior Performance e Confiabilidade a um custo 30% menor. Oferece uma total substituição para o RAID Linux Facilmente transportável pra outros sistemas operacionais. Bundled com o IceNas software para licenciamento. Características RAID n • Desenvolvimento exclusivo do Software. • Inostor já está trabalhando no RAIDn a 3 anos e com prédesenvolvimento de 8 anos. • O Time da Inostor é formado de engenheiros com uma sólidade expertise no desenvolvimento de RAID & Network Storage. Exemplo - RAIDn RAIDn proporciona 7 Discos de Capacidade e 03 Discos de Redundância 3, utilizando os mesmos 10 discos do padrão Raid 5+1 Dados Striping Paridade Os -----------------------dados permanecem Salvos Todos os Dados Foram Perdidos Comparado com o Exemplo do nível Raid 5+1, Raidn proporciona 75% a mais de capacidade além de permitir que 03 Discos Falhem simultaneamente JBOD (Just a Bunch Of Disks) • Descrição JBOD – JBOD é simplesmente um grupo de discos. O Disk arrays pode ser configurado para ser visto pelo servidor como um grupo de discos independentes. Na maior parte das vezes não oferece um uso eficiente para aplicações de Array . – Uma vantagem utilizando JBOD é a possibilidade de se criar um um disco virtual em vários • Falha durante a Operação – Caso um disco falhe, terá o mesmo efeito que se um disco individual falha-se em uma configuração SCSI padrão. Os dados são perdidos e o disco torna-se indisponível. Continuação JBOD • Características de Performance – Tomando em consideração que a maioria das controladoras RAID utilizam memória cache, podemos considerar um pequeno incremento de performance pelo uso deste artifício. • Considerações de Custo – Principalmente pelo benefícios serem limitados, o uso de um sistema RAID JBOB não é considerada um boa solução do ponto de vista de “custo benefício”. • Níveis RAID 2 & 4 – Sim, eles existem. Embora, estes dois níveis RAID oferecem poucos benefícios em relação aos níveis 3 & 5 com muito mais overhead eles não são comercialmente viáveis. Resumo dos Níveis RAID TYPES OF RAID RAID Level 0 Description Disk striping across multiple drives Data Transfer Rate I/O Request Rate Very high read & write Very high read & write Advantages High performance Low cost No redundancy Low MTBF High reliability High performance 1 Disk mirroring Very high read Double read Disadvantages Usage Non critical data storage Fast data transfer High cost No load balancing Markets Government Media Mission critical data Small network Single user Desktop Normal write Slightly slower write Very high read & write High reliability High performance Higher cost Mission critical data ISP’s Government Banking Similar to a single disk. High reliability Lower cost Low write performance Read oriented Single user Large sequential records Government Video / Audio Data warehousing High read rate applications 0+1 Disk mirroring and striping Very high read & write 3 Byte-level striping with DEDICATED non-striped parity disk. Very high read Low write 5 Block-level striping with DISTRIBUTED striped parity. Very high read Very high read Lower write Lower write High reliability Lower cost Low write performance Read oriented Multi-user Small records Banking Government Transaction services Custos Envolvidos na implementação de Sistemas RAID • O RAID 1 com espelhamento de um para um, com um sistema RAID com chassi externo – Para RAID 1 (Espelhamento) – RAID I/O Flyer com três discos rígidos 30.7 GB – Necessita da controladora SCSI no servidor •Total = $3,220.00* • O RAID 1 com espelhamento de um para um, utilizando controladora RAID Mylex AcceleRAID (Sistema Interno ao Servidor) – Controladora: $399.00 – 2 Discos de 40 GB: $400.00 cada ($ 800.00) – Cabos = $ 20.00 •Total = $ 1,219.00* • RAID 1 Solução externa Megahaus – Chassi externo RAID com 2 Discos de 36 GB = $1,199.00 – Controladora ATTOPCI RAID = $395.00 – Cabos 2 X $20.00 = $40.00 •Total = $1,634.00* * Preços EUA Triangulo de Custo, Performance, Disponibilidade Highest Performance RAID 0+1 RAID 0 JBOD* Lowest Cost * Just a Bunch Disks RAID 5 RAID 3 RAID 1 Highest Availability Os sistemas RAID foram desenvolvidos para alta disponibilidade e não para backup • Protege contra falhas de Hardware, não protegendo contra falhas de Software • Não possui mídia removível • Não oferece estabilidade na recuperação de dados (Ex.: Uma vez que os dados foram deletados ou contaminados por vírus digital os dados estarão corrompidos e não há como reverter sem backup) • O esquema Snapshot (utilizando espelhamento RAID 1 com sincronismo) é a única forma baseada em disco que oferece o mesmo nível de segurança de uma Backup em fita (porém sem segurança física) além do mais deve ser investido a mesma capacidade em disco duas vezes – Escalabilidade em capacidade significa que, para cada MB de storage adicionado uma capacidade adicional de 2 MB deve ser adquirida. • As técnicas de Snapshot utilizam filtros para salvar somente os dados críticos, somente o backup em fita permite 100% de todos os dados, além de permitir agendamento automático, update/sincronismo – significando proteção TOTAL. para MAIS INFORMAÇÕES visite nos na web : www.inostor.com.br ou email: [email protected] Tandberg Data São Paulo, SP