Interfaces
•
•
•
•
As
–
–
–
Interfaces são escolhidas baseadas na:
Velocidade (capacidade em transferir os dados)
Distancia (qual a distância que ela pode transferir os dados)
Robustez (Posso interromper a transmissão e depois restaurar?
Como posso adicionar novos dispositivos com o sistema “ligado”?)
– Tamanho do endereçamento (Quantos dispositivos posso
conectar?)
– Custo (Quanto tudo isso me custa)
Dois tipos comuns de interfaces, são a serial e paralela
Serial baixo custo de implementação, geralmente suportam distancias
elevadas
• Mouse, modem, USB, rede local
– Paralela alto custo, porem, com altas taxas de Transferência
• Impressora, SCSI
O processamento avançado dos sinais analógicos estão incentivando
cada vez mais performance tanto nas interfaces seriais como paralela
Largura de Banda: A Rede Local
vs. Conexão de Storage
Ano
1992
1994
1996
1998
1999
2003
Rede
0.1 MB
1 MB
10 MB
100 MB*
200 MB**
1000MB***
Storage
10 MB
20 MB
40 MB
100 MB
160 MB
320 MB
Diferença
100-to-1
20-to-1
4-to-1
1-to-1
.8 to 1
.33 to 1
*O Gigabit Ethernet pode utilizar técnicas como “trunking” para aumentar e agregar largura de banda
**O Fibre channel proporciona hoje 200 MBS embora o 400 MBS seja eminente
***10-Gigabit Ethernet está atualmente em desenvolvimento
NAS ou SAN?
Clientes
Rede em modo genérico
LAN/WAN/FDDI
Servidores Heterogêneos
Storage Area Network
(SAN)
Controladoras
Array
Com Discos
NAS ou SAN?
Clientes
Rede em modo genérico
LAN/WAN/FDDI
Servidor Unix
De Grande Porte
Servidor Unix
Servidor NT
Servidor NT
Thin Server
otimizado apenas
para acesso a
arquivos, não
precisa de:
- Monitor
- Teclado
Servidor de Arquivos
- Arquivos CIF
- Arquivos NFS
Network Attach Storage
(NAS)
NAS ou SAN?
Portanto qual a diferença?
(1) A Conecção
– SAN utiliza Fibre Channel
– NAS utiliza redes TCP/IP Networks: Ethernet, FDDI, ATM
(possivelmente algum dia TCP/IP sobre Fibre Channel)
(2) Os Protocolos
– SAN utiliza SCSI encapsulado
– NAS utiliza Protocolos de File Server: NFS, CIFS, HTTP
A Diferença (2) É a mais Importante
SAN é caro para o segmento Entry Level e Mid Range
Item
NAS
SAN
Comentário
Preço de entrada da
tecnologia
Começa abaixo de $3,000
>$10,000
O menor NAS é um simples
disco rígido conectado a uma
porta Ethernet (DASD)t, O
menor SAN necessita Fibre
HBA, Cabeamento Fibre , SAN
software, Discos em Fibre
Infra Estrutura
Utiliza a mesma estrutura
de Rede
Necessita de Infra Estrutura
de Fibre channel
O Investimento Necessário em
Fibre channel HBA’s e
Cabeamento Fibre Channel =
$750 por nó vs. Ethernet $150
por nó.
Software
Não necessita, utilizar os
protocolos nativos
Necessita de um ‘SAN
OS” instalado em cada
cliente
Adicione $$$ para o
software de SAN
Periféricos de Storage
Usa periféricos padrão
SCSI, entretanto a sua
expansão é limitada se
comparamos com a SAN
Geralmente requer
conecção direta Fibre para
cada periférico
Discos Fibre custam no mínimo
30% a mais dos o mesmo disco
em SCSI, Fibre bridges
(SCSI<>Fibre) continuam ao
redor de $1,000 por nó
Gerenciamento
Geralmente utiliza SNMP e
DNS (Serviços existentes
na rede) para
gerenciamento e suporte
Requer da mesma forma
um software de
gerenciamento específico,
treinamento especializado e
arquitetura Fibre Channel
Adicione $$$ pelo SAN
software, Adicione $$
e tempo para treinamento
pessoal.
Detalhes sobre o
Armazenamento em
disco com RAID
Conceitos de RAID
• Um simples Disco Rígido físico ou multiplos discos em
um gabite externo sem funcionabilidades RAID é
geralmente chamado de
– JBOD (Just A Bunch Of Disks)
– SAS (Server Attached Storage) podendo estar dentro do
servidor.
• O projeto e pesquisa RAID foi desenvolvido pela
Universidade de Berkley (CA-USA) nos anos 80.
– Tema Original = Redundant Array of Independant Disks
– Atualmente = Redundant Array of Inexpensive Disks
• RAID combina um número independente de discos
juntos proporcionando aumento do
throughput/performance no acesso e confiabilidade dos
dados
– Níveis RAID diferentes proporcionam uma variedade de
misturas de performance e tolerância a falhas
Aplicações RAID
• Aplicações com Alta Taxa de Transferência (Ambientes tipicamente RAID 0)
• RAID striping é o ideal para aplicações com intensa transferência de dados
– Aplicações que necessitam de uma grande quantidade de dados a ser
processada em um intervalo de tempo pré-definido
– Streaming Media
• Video on demand, Digital Cable, Transmissões ao vivo
– A taxa de dados fixa é critica, Transmissões múltiplas não
devem degradar a qualidade “QoS” = Quality of Service
– Stream contínuo de dados – sem espaço para o reenvio
• Processamento de Imagem, manipulação e Renderização
• Aplicações com alto índice de solicitações de informação (ambiente típico
para o RAID 5)
• RAID é utilizado para aplicações de alto uso de multitasking, alta taxa de
retorno de informação
• OLTP = On Line Transaction Processing (aplicações típicas)
– Validação de cartão de crédito, Reservas, ECommerce, Gerenciamento
de estoque on-line
– Banco dados e aplicações Web based
– Alto número de transações randômicas
Um Overview da Tecnologia RAID
• O que é RAID?
– Dois ou mais discos rígidos independentes.
– Aparece no servidor como um único Grande Disco Rígido .
– Sistema Operacional totalmente independente.
– Dispositivo com alta confiabilidade e redundância.
• Aumento da Disponibilidade dos Dados
– Rápido acesso aos dados (multiple drives).
– Segurança oferecida pela redundância/paridade.
• Gerenciamento Simplificado
– Partição de um único Drive para gerenciamento/partição.
• Componentes Hot-Swap
– Tanto para um ou vários drives.
– Fontes de Alimentação e Ventilação, também.
• O que RAID não é
– Suporte a aplicações de Disaster Recovery Físicos
(Tape Drivers).
RAID Level 0
0123, 4567, 8901, 2345, 6789, 1234, 5678, 9012, 3456, 7890, 0001, 0002, 0003, 0004, 0005, 0006
Data Stream
RAID Level 0: Disk Striping
0123 (1)
4567 (2 )
8901(3)
2345 (4 )
6789 (5)
1234 (6 )
5678 (7)
9012 (8 )
3456 (9)
7890 (10 )
0001 (11)
0002 (12 )
0003 (13)
0004 (14 )
0005 (15)
0006 (16 )
Disk 1
Disk 2
Disk 3
Disk 4
Block order shown in parentheses
RAID Level O provides high performance through disk stiping
Níveis Raid
RAID Level 0 - Striping
• Uso de múltiplos Discos para a formação de um único Disco lógico.
• Performance na implementação do RAID
• Alta performance na Escrita e Leitura (Write and Read) performance
relacionada com o aumento da quantidade de Discos.
• Os Discos Rígidos são distribuídos utilizando-se uma tamanho definido
de “stripe” durante a configuração
– Deve ser otimizado em conjunto com o Sistema Operacional para
uma performance otimizada
• As pequenas solicitações que possuem o mesmo tamanho de “stripe”
são transmitidas a um único Disco Rígido, as solicitações maiores são
divididas e transmitidas a múltiplos Discos Rígidos em paralelo
• A capacidade é a soma do número de discos no “array”
• Não proporciona proteção contra falhas de hardware, somente
performance.
Resumo Nível: RAID 0
• RAID-0, “Striping”, todos os Discos estão disponíveis
para dados, Inseguro.
• Utilizado para armazenamento temporário
• Qualquer Disco que falhar causa a perda dos dados
10 = Total de Discos
10 = Capacidade Usável
0 = Redundância de Discos
10 = Performance Leitura
10 = Performance Escrita
Dados
Todos os Dados
Foram Perdidos
RAID Level 1
0123, 4567, 8901, 2345
Data Stream
RAID Level 1: Disk Mirroring
0123 (1)
0123 (1 1)
4567 (2)
4567 (2 1)
8901 (3)
8901 (3 1)
2345 (4)
2345 (4 1)
Disk 1
Copy of Disk 1
Block order shown in parentheses
RAID Level 1 provides fully redundant disk mirroring
Níveis Raid
RAID Level 1 - Espelhamento
• O RAID 1 proporciona alto nível de tolerância a falhas
– Cada solicitação de I/O é espelhada em um segundo Disco Rígido
• O RAID 1 trabalha com múltiplos de dois Discos Rígidos- o set primário e
o set espelhado – dobrando também o custo por GB da solução
– Proporciona o mesmo throughput durante a escrita
– Oferece mais performance durante a leitura (read) – A controladora
RAID executa o mesmo comando de leitura em cada Disco – assim
que um dos discos disponibiliza os dados, ele é automaticamente
transferido para o servidor e o próximo comando de leitura pode ser
processado.
• Oferece proteção contra falhas nos discos com taxa de 1 para 1
– Assim que um disco falha, automaticamente o espelho assume,
porém caso ocorra a falha no espelho não existe mais segurança
– Pode proteger contra desastre naturais/físicos porém o espelho deve
estar instalado remotamente (em outro local físico) acarretando em
um custo adicional $$.
– Não protege contra vírus digital ou acidentes/delete intencional, já
que 100% do disco está sincronizado com o outro
• Implementação de Alto Custo
– Controladora RAID +
– Custo por GB de chega a ser o dobro se compararmos
com uma unidade simples.
Resumo Nível: RAID 1
• RAID-1, “Mirroring” rápido, 50% dos Discos estão
disponíveis para dados, extremamente seguro.
• Utilizados para informações importantes
• Qualquer Disco espelhado pode falhar, e os dados
permanecem salvos
Data
Copy
2 = Total de Discos
1 = Capacidade Usável
1 = Redundância de Discos
2 = Performance Leitura
1 = Performance Escrita
Os dados permanecem Salvos
-----------------------Todos os Dados
Foram Perdidos
RAID Level 3
0123, 4567, 8901, 2345
Data Stream
RAID Level 3: Dedicated Parity Parallel Access
0
1
2
3
6
4
5
6
7
22
8
9
0
1
18
2
3
4
5
14
Data Disk 1
Data Disk 2
Data Disk 3
Data Disk 4
Parity Disk
Byte level striping shown here
RAID Level 3 uses separate parity disk
Paridade e ECC
• Utiliza metodologia de reconstrução dos dados perdidos, adicionandose informações adicionais, comumente chamada de “overhead”
• Utiliza cálculos Matemáticos Polinomiais e operações inversas
• È utilizada uma equação de 5th Grau para encontrar a soma e o
resultado.
(5+10+?+2+7 = 27)
– O método de detecção de erros com paridade em computadores
Bit
funciona apenas para a detecção do erro.
Error
Método de Paridade no barramento SCSI
Binary
128
64
32
16
8
4
2
1
Parity
Bit
Number
2
0
0
0
0
0
0
1
0
0
1
6
0
0
0
0
0
1
1
0
1
3
33
0
0
1
0
0
0
0
0
1
2
33
0
0
1
0
0
0
0
1
1
3
Number
Parity Sum
Error
Parity
Níveis Raid
RAID Level 3 – Acesso Sincronizado com
disco dedicado de paridade
• O Uso de mais Discos possibilita um aumento do throughput
– Um único de Disco de paridade pode ser um problema de gargalo
na performance
• Proteção contra falha de Disco com razão de 1 para vários
– A Performance é degradada durante o acesso, e especificamente
durante a reconstrução em caso de falha (rebuild) de um disco
rígido (demorando horas)
– Não oferece proteção contra desastre físicos
– Não protege contra vírus digital ou acidentes/delete intencional,
já que os dados são protegidos por um esquema de paridade ECC
(com esquema e atualização em tempo real)
• Implementação de Alto Custo
– Custo da Controladora RAID +
– Discos Rígidos com sincronização de spindle
– 1 Disco Rígido adicional para Paridade
– Implementado como um sistema RAID
(gabinete stand alone)
RAID Level 5
0123, 4567, 8901, 2345, 6789, 1234, 5678, 9012, 3456, 7890, 0001, 0002, 0003, 0004, 0005, 0006
Data Stream
RAID Level 5: Distributed Parity Independent Access
0123 (1)
4567 (2 )
8901(3)
2345 (4 )
15936 (P)
6789 (5)
1234 (6 )
5678 (7)
22713 (P)
9012 (8 )
3456 (9)
7890 (10 )
11349 (P)
0001 (11 )
0002 (12 )
0003 (13)
0018 (P)
0004 (14)
0005 (15 )
0006 (16 )
Disk 1
Disk 2
Disk 3
Disk 4
Disk 5
Block order shown in parentheses
(P) = Calculated parity value
RAID Level 5 distributes parity across all drives
Níveis Raid
RAID Level 5 – Acesso Independente com
paridade distribuída
•
•
•
O uso de mais discos possibilita o aumento da performance RAID 5, é
geralmente utilizado em ambientes OLTP
Proteção contra falha de Disco com razão de 1 para vários
– Qualquer disco rígido (1) pode falhar e mesmo assim o sistema
permanece intacto
– Não oferece proteção contra desastre físicos
– Não protege contra vírus digital ou acidentes/delete intencional, já
que os dados são protegidos por um esquema de paridade ECC
(com esquema e atualização em tempo real)
Implementação de Alto Custo
– Capacidade com perda pela Paridade, o crescimento dos dados
aumenta o custo por GB
– Custo da Controladora RAID +
– Implementado como um sistema RAID
(gabinete stand alone)
Resumo Nível: RAID 5
• RAID-5, rápido, todos menos um disco está disponível
para dados, Segurança.
• Utilizado com Armazenamento Primário
• Caso um Disco falhe ”OK”, O segundo Disco ocasiona a
perda total dos dados!
10 = Total de Discos
8 = Capacidade Usável
1 = Redundância de Disco
8 = Performance Leitura
8 = Performance Escrita
Data
Paridade
Os dados permanecem Salvos
-----------------------Todos os Dados
Foram Perdidos
Hot Spare
RAID Level 0+1
0123, 4567, 8901, 2345, 6789, 1234, 5678, 9012, 3456, 7890, 0001, 0002, 0003, 0004, 0005, 0006
Data Stream
RAID Level 0+1: Striped Mirrored Array
0123 (1)
4567 (2 )
8901(3)
2345 (4 )
6789 (5)
1234 (6 )
5678 (7)
9012 (8 )
3456 (9)
7890 (10 )
0001 (11)
0002 (12 )
0003 (13)
0004 (14 )
0005 (15)
0006 (16 )
Disk 1
Disk 2
Disk 3
Disk 4
0123 (1 1)
4567 (2 1)
8901(3 1)
2345 (4 1)
6789 (5 1)
1234 (6 1)
5678 (7 1)
9012 (8 1)
3456 (9 1)
7890 (10 1)
0001 (11 1)
0002 (12 1)
0003 (13 1)
0004 (14 1)
0005 (15 1)
0006 (16 1)
Copy of Disk 1
Copy of Disk 2
Copy of Disk 3
Block order shown in parentheses
RAID Level 0+1 combines data striping and disk mirroring
Copy of Disk 4
Combinação de níveis RAID
• RAID 00, 10, 30, 50
• Múltiplos níveis RAID 0, 1, 3, ou 5 Arrays podem ser
“striped” entre eles para a criação dos níveis RAID 00, 10,
30 ou 50
– Proporciona mais capacidade
– Freqüentemente chamado de composição RAID
• Proporciona um melhor “load balancing”.
Interface da Aplicação
RAID 0 Stripping
RAID 1
RAID 1
RAID 1
ARRAY
ARRAY
ARRAY
Resumo Nível: RAID 0+1
•
•
•
O RAID-10, é extremamente rápido, metade dos Discos estão
disponíveis para Disco/ dobro do Preço, Seguro.
Usado para dados primários e críticos
Caso um Disco falhe ”OK”, O segundo ocasiona a perda dos dados!
Os dados permanecem Salvos
-----------------------Todos os Dados Foram Perdidos
Data
Grupo #1
Dados Críticos
Grupo #2
Espelho (Cópia)
20 = Total de Discos
10 = Capacidade Usável
*2 = Redundância de Discos
20 = Performance Leitura
10 = Performance Escrita
Resumo Nível: RAID 5+1
RAID 5+1 oferece 4 discos de capacidade porém
com necessidade total de 10 discos:
Dados
Paridade
Grupo #1
Dados Críticos
Grupo #2
Espelho (Cópia)
Striping
Paridade
Os
dados permanecem Salvos
------------------------
Todos os Dados Foram Perdidos
Introduzindo o RAIDn
•
•
A INOSTOR detê a patente de um inovador algorítimo RAID,
que incorpora um novo conceito em nível RAID, este novo
algorítimo é chamado de RAIDn
RAIDn pode ser implementado tanto em software como em
hardware
– Inicialmente o RAIDn está desenvolvido como um
pacote de software
•
•
Comparando-se com as tecnologias RAID tradicionais, RAIDn
oferece maior confiabilidade e melhor utilização do disco ao
mesmo custo
A INOSTOR utilizará a tecnologia RAIDn em seus próprios
sistemas de storage, entretanto ela também estará
disponível via licenciamento para outras empresas que
tiverem interesse.
Porque RAIDn
•
•
•
•
•
•
•
Nova tecnologia que proporciona proteção superior a
ambientes de missão crítica quando comparados com os
produtos RAID atuais.
Segurança contra falhas de múltiplos Discos, ideal para
aplicações de missão crítica.
Melhor confiabilidade, baixo custo, alta performance.
Exemplo: Mesma Capacidade, Maior Performance e
Confiabilidade a um custo 30% menor.
Oferece uma total substituição para o RAID Linux
Facilmente transportável pra outros sistemas operacionais.
Bundled com o IceNas software para licenciamento.
Características RAID
n
•
Desenvolvimento exclusivo do Software.
•
Inostor já está trabalhando no RAIDn a 3 anos e com prédesenvolvimento de 8 anos.
•
O Time da Inostor é formado de engenheiros com uma sólidade
expertise no desenvolvimento de RAID & Network Storage.
Exemplo - RAIDn
RAIDn proporciona 7 Discos de Capacidade e 03
Discos de Redundância 3, utilizando os mesmos 10
discos do padrão Raid 5+1
Dados
Striping
Paridade
Os -----------------------dados permanecem Salvos
Todos os Dados Foram Perdidos
Comparado com o Exemplo do nível Raid 5+1, Raidn
proporciona 75% a mais de capacidade além de
permitir que 03 Discos Falhem simultaneamente
JBOD (Just a Bunch Of Disks)
• Descrição JBOD
– JBOD é simplesmente um grupo de discos. O Disk
arrays pode ser configurado para ser visto pelo
servidor como um grupo de discos independentes. Na
maior parte das vezes não oferece um uso eficiente
para aplicações de Array .
– Uma vantagem utilizando JBOD é a possibilidade de
se criar um um disco virtual em vários
• Falha durante a Operação
– Caso um disco falhe, terá o mesmo efeito que se um
disco individual falha-se em uma configuração SCSI
padrão. Os dados são perdidos e o disco torna-se
indisponível.
Continuação JBOD
• Características de Performance
– Tomando em consideração que a maioria das controladoras
RAID utilizam memória cache, podemos considerar um
pequeno incremento de performance pelo uso deste
artifício.
• Considerações de Custo
– Principalmente pelo benefícios serem limitados, o uso de
um sistema RAID JBOB não é considerada um boa solução
do ponto de vista de “custo benefício”.
• Níveis RAID 2 & 4
– Sim, eles existem. Embora, estes dois níveis RAID
oferecem poucos benefícios em relação aos níveis 3 & 5
com muito mais overhead eles não são comercialmente
viáveis.
Resumo dos Níveis RAID
TYPES OF RAID
RAID
Level
0
Description
Disk striping across
multiple drives
Data
Transfer
Rate
I/O
Request
Rate
Very high
read & write
Very high
read & write
Advantages

High
performance
Low cost

No redundancy

Low MTBF


High reliability
High
performance



1
Disk mirroring
Very high
read
Double read
Disadvantages
Usage

Non critical data
storage

Fast data transfer
High cost
No load
balancing

Markets


Government
Media
Mission critical
data



Small network
Single user
Desktop
Normal write
Slightly
slower write
Very high
read & write


High reliability
High
performance

Higher cost

Mission critical
data



ISP’s
Government
Banking
Similar to a
single disk.


High reliability
Lower cost

Low write
performance



Read oriented
Single user
Large sequential
records



Government
Video / Audio
Data
warehousing
High read rate
applications
0+1
Disk mirroring and
striping
Very high
read & write
3
Byte-level striping
with DEDICATED
non-striped parity
disk.
Very high
read
Low write

5
Block-level striping
with DISTRIBUTED
striped parity.
Very high
read
Very high
read
Lower write
Lower write

High reliability

Lower cost

Low write
performance



Read oriented
Multi-user
Small records



Banking
Government
Transaction
services
Custos Envolvidos na
implementação de Sistemas RAID
• O RAID 1 com espelhamento de um para um, com um sistema RAID
com chassi externo
– Para RAID 1 (Espelhamento)
– RAID I/O Flyer com três discos rígidos 30.7 GB
– Necessita da controladora SCSI no servidor
•Total = $3,220.00*
• O RAID 1 com espelhamento de um para um, utilizando controladora
RAID Mylex AcceleRAID (Sistema Interno ao Servidor)
– Controladora: $399.00
– 2 Discos de 40 GB: $400.00 cada ($ 800.00)
– Cabos = $ 20.00
•Total = $ 1,219.00*
• RAID 1 Solução externa Megahaus
– Chassi externo RAID com 2 Discos de 36 GB = $1,199.00
– Controladora ATTOPCI RAID = $395.00
– Cabos 2 X $20.00 = $40.00
•Total = $1,634.00*
* Preços EUA
Triangulo de Custo,
Performance, Disponibilidade
Highest
Performance
RAID
0+1
RAID
0
JBOD*
Lowest
Cost
* Just a Bunch Disks
RAID
5
RAID
3
RAID
1
Highest
Availability
Os sistemas RAID foram desenvolvidos para
alta disponibilidade e não para backup
• Protege contra falhas de Hardware, não protegendo contra falhas de
Software
• Não possui mídia removível
• Não oferece estabilidade na recuperação de dados (Ex.: Uma vez
que os dados foram deletados ou contaminados por vírus digital os
dados estarão corrompidos e não há como reverter sem backup)
• O esquema Snapshot (utilizando espelhamento RAID 1 com
sincronismo) é a única forma baseada em disco que oferece o
mesmo nível de segurança de uma Backup em fita (porém sem
segurança física) além do mais deve ser investido a mesma
capacidade em disco duas vezes
– Escalabilidade em capacidade significa que, para cada MB de
storage adicionado uma capacidade adicional de 2 MB deve ser
adquirida.
• As técnicas de Snapshot utilizam filtros para salvar somente os
dados críticos, somente o backup em fita permite 100% de todos os
dados, além de permitir agendamento automático,
update/sincronismo – significando proteção TOTAL.
para MAIS INFORMAÇÕES
visite nos na web :
www.inostor.com.br
ou
email: [email protected]
Tandberg Data
São Paulo, SP
Download

O que é RAID?