FACULDADE DE TECNOLOGIA
PADRE ANCHIETA
Curso de SISTEMAS DE INFORMAÇÃO
ARMAZENAMENTO DE DADOS: STORAGE AREA NETWORK
Mariana Monteiro
Monografia apresentada à disciplina Projeto de
Final de Curso, do Curso de Sistemas de
Informação da Faculdade de Tecnologia Padre
Anchieta, sob a orientação do Prof. Carlos
Eduardo Câmara, como exigência parcial para
conclusão do curso de graduação.
Orientador: Prof. Carlos Eduardo Câmara
Jundiaí – São Paulo – Brasil
11/2005
ii
Armazenamento de dados: Storage Area Network
Mariana Monteiro
Monografia defendida e aprovada em 01 de dezembro de 2005 pela Banca
Examinadora assim constituída:
Prof Ms/Dr Carlos Eduardo Câmara (Orientador)
FATEPA – Faculdade de Tecnologia Padre Anchieta – Jundiaí – SP.
Prof Ms/Dr Marcos Paulo Rebello (Membro Interno)
FATEPA – Faculdade de Tecnologia Padre Anchieta – Jundiaí – SP.
Prof Ms Vanderlei Ienne (Membro Externo)
UNICAMP – Universidade Estadual de Campinas – Campinas – SP.
iii
Deus marcou o tempo certo para cada coisa. Ele
nos deu o desejo de entender as coisas que já
aconteceram e as que ainda vão acontecer,
porém
não
nos
deixa
compreender
completamente o que ele faz. Então entendi que
nesta vida tudo o que a pessoa pode fazer é
procurar ser feliz e viver o melhor que puder.
(Eclesiastes 3:11-12)
iv
A meus amigos, sem os quais não chegaria até
aqui, em especial Weber Abreu, Eduardo Ogura,
Vitor Martins e Gerson Freire.
A meus tios Luciano e Adriana pela ajuda em todos
os sentidos.
A meu namorado Bruno que sempre esteve
presente nas horas mais difíceis.
A minha mãe, pelo cumprimento fiel e perfeito de
seu papel, cercando de carinho e incentivo todas as
atitudes da minha vida.
Aos meus cachorros Gugu e Bob, a quem tantas
horas de brincadeiras adiadas sem que estes
compreendessem o porquê.
Agradeço em especial á Deus, pelos desafios
lançados durante este período.
Sou eternamente grata a todos.
v
AGRADECIMENTOS
Agradeço a Deus, em primeiro lugar, pela força e luz recebida nos meus maiores
momentos de dificuldades.
Agradeço ao Professor Carlos Eduardo Câmara, orientador, que acreditou em mim e
incentivou-me para a conclusão deste trabalho, face aos inúmeros percalços do trajeto.
Alguns experimentos e vários “entendimentos” não teriam sido possíveis sem a
colaboração de Eduardo Ogura, Gerson Freire e Weber Abreu.
Eu agradeço fraternalmente a todos.
vi
SUMÁRIO
AGRADECIMENTOS ............................................................................................................................................. v
SUMÁRIO ................................................................................................................................................................ vi
Lista de Siglas.......................................................................................................................................................... vii
Lista de Figuras......................................................................................................................................................viii
RESUMO .................................................................................................................................................................. ix
ABSTRACT.............................................................................................................................................................. ix
1.
INTRODUÇÃO ............................................................................................................................................... 1
2.
STORAGE: ARMAZENAMENTO DE DADOS......................................................................................... 2
3.
TIPOS DE TOPOLOGIAS ............................................................................................................................ 3
3.1.
DAS :Direct Attached Storage ................................................................................................................ 3
3.2.
NAS: Network Attached Storage............................................................................................................. 4
3.3.
SAN: Storage Area Network ................................................................................................................... 4
3.4.
História.................................................................................................................................................... 6
3.5.
Benefícios da Tecnologia SAN................................................................................................................ 7
3.6.
Protocolos................................................................................................................................................ 8
3.6.1. Fibre Channel..................................................................................................................................... 8
3.6.2. Hardware............................................................................................................................................ 9
3.7.
Software ................................................................................................................................................. 11
3.8.
RAID (Redundant Array of Independent Disks) ................................................................................... 12
3.8.1. Raid 0................................................................................................................................................ 13
3.8.2. Raid 1................................................................................................................................................ 13
3.8.3. Raid 5................................................................................................................................................ 14
3.8.4. RAID 0 + 1 ou RAID 10 .................................................................................................................. 15
3.9.
Gerenciamento da SAN ......................................................................................................................... 15
3.10.
Topologias ............................................................................................................................................. 16
4.
SAN X NAS .................................................................................................................................................... 19
5.
CONFIGURAÇÃO DO SISTEMA DE ARMAZENAMENTO.............................................................. 20
6.
CONCLUSÃO ............................................................................................................................................... 22
Referência Bibliográfica........................................................................................................................................ 23
Bibliografia Consultada ......................................................................................................................................... 24
vii
Lista de Siglas
DAS….. ........................................................................Direct Attached Storage
NAS ..............................................................................Network Attached Storage
SAN .............................................................................Storage Area Network
LAN ..............................................................................Local Area Network
WAN.............................................................................Wide Area Network
Storage..........................................................................Armazenamento
FC .................................................................................Fibre Channel
Cabling..........................................................................Cabeamento
Hba................................................................................Host Based Adapter
Raid...............................................................................Redundante
Tools of Management ...................................................Ferramentas de Gerenciamento
Servers ..........................................................................Servidores
Operating Systems ........................................................Sistemas Operacionais
Data...............................................................................Dados
Information ...................................................................Informação
viii
Lista de Figuras
I.
Exemplo de SAN.............................................................................................................................................. 5
II.
Exemplo de Raid 0 ........................................................................................................................................ 13
III. Exemplo de Raid 1 ........................................................................................................................................ 14
IV.
Exemplo de Raid 5 ........................................................................................................................................ 15
V.
Exemplo de Raid 10 ...................................................................................................................................... 15
VI.
Exemplo de Ligação Ponto-a-ponto ............................................................................................................ 16
VII. Exemplo de TopologiaFC-AL...................................................................................................................... 17
VIII. Exemplo de Topologia Fabric...................................................................................................................... 18
IX.
Exemplo de Topologia Mista ....................................................................................................................... 18
X.
Tabela Comparativa entre as Tecnologias................................................................................................. 19
XI.
Exemplo de Topologia Interna do Storage................................................................................................. 20
ix
RESUMO
Storage Area Network ou rede de armazenamento de dados é uma rede de alta
velocidade dedicada a fornecer benefícios diversos relacionados ao acesso a dados. Vem
popularizando-se enormemente no meio corporativo nos últimos anos por trazer vantagens
como altas taxas de transferência para o acesso aos dados, redundâncias que garantem a
continuidade dos negócios em caso de falhas e facilidade para aumentar o espaço em disco
destinado aos servidores integrantes da rede.
Este trabalho tem por objetivo explicar os fundamentos básicos que compõem uma
SAN, assunto de bibliografia ainda escassa, a fim de que todos conheçam esta tecnologia que
vem sendo cada vez mais adotada por empresas em todo o mundo.
ABSTRACT
Storage Area Network is a high-speed network design to provide fast and reliable
access to the data. It is becoming more and more common on IT environments because its
advantage, such as great transfers rates, high availability for business continuance and
scalability to grow the storage to the hosts.
This assignment has the goal to explain the foundations of a SAN (issue with a rare
study material) for all to get to know this technology that has been adopted for companies
around the world.
1
1.
INTRODUÇÃO
Nas últimas duas décadas conhecemos a descentralização tanto do armazenamento de
dados e informações quanto do processamento destas, com a proliferação de redes locais e
servidores. Parecia de fato uma grande idéia, até que nos descobrimos envolvidos por
inúmeras ilhas tecnológicas. O cenário distribuído trouxe, em conseqüência, uma
descentralização do armazenamento das informações. A falta de controle deste ambiente está
levando às altas taxas de crescimento de Terabytes (TB), ao mesmo tempo em que continuam
ocorrendo, com mais incidência, problemas de 1disk full e dificuldades de se localizar
determinada informação. Além disso, essas informações não possuem cópias, muito menos
replicação em lugares distintos. Em que servidor e em que banco de dados ou arquivos se
encontra tal informação? E quando a informação se encontra em estações de trabalho?
Dentro de poucos meses, um PC poderá ter discos de mais de 200GB e se supormos uma
empresa com mil destas maquinas, teremos mais de 200.000GB de espaço sem controle de
seu conteúdo. Este crescimento apenas aumenta a dificuldade de gerenciamento. Está claro
que este modelo de armazenamento de dados está alcançando seus limites. O que precisamos
é de um novo modelo que nos permita, de modo fácil, e gerenciável, administrar as
informações.
A necessidade básica é a consolidação das informações de toda a empresa em um
determinado local, permitindo que todos compartilhem estas informações, diminuindo
significativamente os custos de gerenciamento e tornando a informação ema real vantagem
competitiva. Esse novo modelo já existe, é chamado Storage Area Network (SAN), que
resumindo o conceito numa infra-estrutura de fibra que permite o compartilhamento de
unidades de disco e banda por vários sistemas heterogêneos que também participam nessa
infra-estrutura. Uma rede de propósito especial e de alta velocidade que conecta diferentes
dispositivos de armazenamento a servidores. As redes SAN podem oferecer recursos de
armazenamento para backup e arquivamento para localidades múltiplas e remotas. Um grupo
de serviços de armazenamento de dados ligados com um servidor ou estação gráfica
host, freqüentemente através de switches, utilizando a tecnologia Fibre Channel. A SAN traz
benefícios imediatos á uma empresa, como a redução do custo utilizados para gerir e proteger
dados, a melhora do acesso aos dados, o aumento da capacidade de armazenamento e
escalabilidade.
1
Termo utilizado quando o disco rígido está completo com dados
2
2.
STORAGE: ARMAZENAMENTO DE DADOS
Storage, de modo simplista, é armazenamento de dados. Os dados podem ser
armazenados de diversas maneiras, dos modos mais primitivos até ao que há de melhor em
tecnologia de armazenamento de dados.
Guardar documentos impressos em papel, informações anotadas em cadernos,
enciclopédias... tudo isso são formas de se armazenar dados, também chamados de
informação.
Porém, quando falamos de storage, falamos no armazenamento de grandes
quantidades de dados de corporações em geral, visando à segurança, disponibilidade e fácil
acesso e gerenciamento. Falamos de grandes infra-estruturas de armazenamento que visam o
mercado corporativo, oferecendo elevados níveis de segurança, performance, disponibilidade,
em casos até mesmo de desastres inesperados.
Storage não é somente armazenar é também:
Servir (aplicações, usuários, serviços…).
Disponibilizar (sistemas que não param!).
Proteger (informações que não podem ser perdidas)
Gerenciar (recursos, investimentos, crescimento…).
Flexibilizar (crescimento, recursos, investimentos…).
Hoje os sistemas de storage não são vistos apenas do ponto de vista técnico e
tecnológico e sim como ferramenta essencial para o crescimento das corporações,
continuidade de negócios, redução de custos e investimentos, além, claro de melhores
resultados e maiores lucros.
3
3.
TIPOS DE TOPOLOGIAS
Os Subsistemas de Discos são sistemas inteligentes que agregam grandes quantidades
de discos e softwares, formando grandes repositórios de dados com grandes, porém variáveis
níveis de proteção. [1]
Entre suas características estão vantagens como a redundância total do hardware,
através de fontes e ventiladores redundantes, memória cache espelhada, placas processadoras
redundantes, níveis de RAID e caminhos duplos de fibra. Além disso, contam com sistemas
de proteção via software, como 2snapshots, volumes espelhados e sites espelhos remotos.
Subsistemas de Discos oferecem também toda a centralização e consolidação dos
dados da empresa, aumentando a performance, melhorando e centralizando o gerenciamento
da infra-estrutura e da informação, consolidando servidores e reduzindo custos.
Os Subsistemas de Discos podem ser conectados de três maneiras diferentes:
1)
2)
3)
DAS- Direct Attached Storage
NAS- Network Attached Storage
SAN-Storage Area Network
3.1.
DAS :Direct Attached Storage
Nesta topologia os servidores são conectados diretamente ao subsistema de discos.
Mesmo que exista mais de um servidor conectado diretamente ao subsistema, se não houver
um dispositivo de rede no caminho ainda assim trata-se de uma topologia DAS (Storage
conectado diretamente).
2
Fotografia de determinada área de disco
4
3.2.
NAS: Network Attached Storage
Um NAS ou Network Attached Storage é uma unidade ou servidor de armazenamento
que se liga como qualquer outro servidor à rede da empresa, onde tem a função de servidor de
arquivos. Um servidor NAS entende vários protocolos de rede, adapta-se a vários tipos de
rede e sabe dialogar com sistemas como UNIX, NT ou Netware.
Um dispositivo NAS combina a tecnologia dos 3arrays de discos com a inteligência de
uma pequena unidade de processamento. É comum a familiaridade com o conceito de
“impressora de rede”, ou seja, aquela onde o usuário pode imprimir. Do mesmo modo o NAS
é uma unidade partilhada através da LAN e todos os usuários com os direitos e permissões de
acessos adequados podem montar sistemas de arquivos diretamente sem ter que veicular os
dados através do servidor. [1]
3.3.
SAN: Storage Area Network
Uma SAN é de modo simplificado, uma rede dedicada ao armazenamento de dados,
que conecta dispositivos armazenadores de discos conhecidos por storages aos servidores da
rede. É uma tecnologia relativamente nova e que vem se popularizando bastante no meio
corporativo nos últimos anos, trazendo cada vez mais benefícios para as empresas que a
adotam. O mercado brasileiro de armazenamento de dados cresceu 44,4% em 2003, com uma
movimentação no setor de 1,3 bilhões de dólares. No mundo, este mercado movimentou 25,5
bilhões de dólares em 2003. As perspectivas para 2004 são ainda maiores. [2]
Em linhas gerais, pode-se definir SAN como uma infra-estrutura que permite que
diversos servidores tenham acesso a discos externos de modo rápido e confiável. O conceito
de discos externos já é, há algum tempo, uma tendência mundial, e vem sendo cada vez mais
adotado. Os discos externos não são limitados em espaço como um disco interno, são mais
fáceis de manusear quando necessário e trazem facilidades para o compartilhamento por
3
Agrupamento de elementos
5
vários servidores. A figura central de uma SAN, de fato, é o servidor de discos ou, como é
popularmente conhecido, o storage.
A centralização das operações de armazenamento de dados e seu gerenciamento são as
razões principais pela popularização das SANs. Administrar todos os recursos de
armazenamento em ambientes críticos e de crescimento elevado não é uma tarefa fácil e pode
ser muito dispendioso. Imagine, por exemplo, uma empresa com centenas de servidores que
possuem importante demanda por espaço em disco. Acompanhar máquina a máquina e
gerenciar seus volumes, com certeza não será um tarefa fácil. Com a centralização oferecida
pela SAN, tanto o tempo quanto o custo de gerenciamento destes ambientes é muito reduzido.
Além disso, uma SAN provê uma série de outras vantagens para o acesso a áreas de discos,
como sua alta escalabilidade e confiabilidade.
Uma SAN é implementada utilizando-se componentes de hardware e também
importantes softwares, sem os quais a SAN não traria tantos benefícios quanto conhecemos
hoje. Como veremos no decorrer deste trabalho o conjunto de hardware e software certo é que
vai definir a qualidade da SAN.
Abaixo, vemos uma SAN, representada por uma nuvem e diversos de seus
equipamentos, ao lado de outras redes. A figura nos dá uma idéia de como as tecnologias não
são isoladas, mas se integram.
I.
Exemplo de SAN
6
3.4.
História
A idéia da SAN nasceu em 1987, quando Patterson, Gibson e Katz, da Universidade
da Califórnia, publicaram o artigo A Case for Redundant Arrays of Inexpensive Disks (RAID).
As idéias apresentadas e explicadas no artigo sugeriam combinar vários discos de pequeno
porte, não muito caros, em uma matriz a fim de obter características que discos isolados não
eram capazes de oferecer. Estas novas características tratavam, principalmente, de melhorar a
performance de leitura e escrita e preservar automaticamente o conteúdo dos discos durante e
depois da falha de componentes do disco. Com os discos em RAID, nasceram os servidores
de discos, os storages, que são o centro de uma SAN.
Um acontecimento que também foi muito importante para o surgimento desta
arquitetura foi o desenvolvimento do padrão Fibre Channel (FC), utilizado nas SANs. Fibre
Channel é um protocolo de transferência de dados, que faz uso do meio físico de fibra ótica.
Acompanhando o processo de popularização das SANs, os diferentes fornecedores
começaram a tentar definir seus próprios padrões FC, o que estava atrapalhando o
desenvolvimento do padrão. Assim, foram criadas algumas organizações para definir as regras
para o novo padrão. Entre elas, destacam-se a FCIA (Fibre Channel Industry Organization) e
a SNIA (Storage Networking Industry Association).
A FCIA foi criada em agosto de 1999, da fusão da Fibre Channel Association e Fibre
Channel Community. É uma organização de benefício mútuo, sem fins lucrativos, formada
por fabricantes, integradores de sistemas, desenvolvedores, vendedores, profissionais da
indústria e usuários. O objetivo da FCIA é criar bases para a tecnologia de infra-estrutura FC,
a fim de que várias aplicações dentro dos complicados mercados de Storage e TI possam ser
suportadas. [2]
A SNIA foi criada em Dezembro de 1997 ,é uma associação sem fins lucrativos que
dedica-se a garantir que as redes de armazenamento de dados tornem-se soluções completas e
confiáveis dentro da comunidade de tecnologia.[2]
7
3.5.
Benefícios da Tecnologia SAN
Podem-se citar como principais benefícios proporcionados por uma arquitetura de
SAN:
Alta performance no acesso aos dados: as taxas de transferência nas SAN mais
modernas podem chegar a até 2 Gbp/s. Além disso, dependendo do arranjo dos discos
(RAID), pode haver grande ganho de performance na leitura e/ou escrita, como veremos
adiante neste trabalho;
Alta disponibilidade e confiabilidade: uma SAN possui diversas formas de
aumentar a disponibilidade dos dados de modo que, mesmo em caso de falha de alguns
discos, a produção na seja interrompida. Opções como caminhos redundantes para acesso aos
dados e espelhamento de dados em tempo real pode assegurar a disponibilidade dos dados e
aplicações.
Escalabilidade: capacidade de adicionar mais capacidade de armazenamento e
outros recursos à infra-estrutura já existente. Isto é feito facilmente dentro de uma SAN,
freqüentemente sem a necessidade de desligar o(s) servidor(s) ou seus clientes de rede;
Centralizar a administração dos recursos: nos ambientes atuais, cada vez mais
complexos, isto pode ser a única solução para a administração dos recursos de discos,
trazendo grandes economias para as empresas.
Descongestionamento da LAN: em muitos casos a rede local é lenta devido ao
grande fluxo de informações que trafega por ela. Com uma SAN, este fluxo é bastante
reduzido, o que alivia a rede local, beneficiando os usuários. Isto também é muito importante
para o backup corporativo, que também pode ser feito sem utilizar a rede local.
Além destes ganhos, há outros que variam um pouco dependendo da solução adotada e
dos fornecedores escolhidos, tal como balanceamento de carga e facilidades para backup.
Estas facilidades focam em alternativas para aplicações em que não há janela para backup
disponível, já que elas exigem disponibilidade integral.
8
3.6.
Protocolos
SANs podem ser implementadas utilizando interfaces, de diferentes tipos. Os
protocolos suportados por SAN são os seguintes:
FCP: Fibre Channel Protocol
FCIP: Fibre Channel sobre TCP/IP
IFCP: Internet Fibre Channel Protocol
SCSI: Small Computer System Interface
ISCSI: Internet Small Computer System Interface
ISNS: Internet Storage Name Service
SAS: Serial Attached SCSI
Atualmente, Fibre Channel é o padrão utilizado na maioria das SANs.
3.6.1. Fibre Channel
A tecnologia Fibre Channel está se tornando o elemento chave para viabilizar uma
Storage Network. As características do Fibre Channel permitem que topologias do tipo de
redes possa ser aplicadas no ambiente de armazenamento de dados como a base do paradigma
emergem do Storage Network. [3]
O surgimento de plataformas que empregam componentes de rede com base no Fibre
Channel, tais como hubs e switches, oferecem melhorias dramáticas na forma com que as
empresas gerenciam, protegem e compartilham volumes crescentes de informações com
missão crítica.
O Fibre Channel oferece vários benefícios para os servidores de armazenamento de
informações: distância maior entre os sistemas, consolidação de dados, conectividade aberta e
maior taxa de transferência de dados.
O Fibre Channel permite interligar servidores e sistemas de armazenamento de dados
através de distâncias maiores. As atuais implementações de SCSI impõem uma limitação na
distância de apenas 25 metros entre os servidores e os sistemas de armazenamento de dados.
9
O Fibre Channel permite que os dispositivos da rede de Storage possam ser separados por
distâncias de até 10 km, ou seja, 400 vezes com relação à SCSI. [3]
A conectividade Fibre Channel permite que as organizações possam consolidar dados
entre servidores e sistemas de armazenamento de dados bastante dispersos, e ao mesmo
tempo, dar suporte para os crescentes volumes e tipos de dados corporativos. Até agora, a
conectividade era restrita a esquemas de conexão ponto-a-ponto relativamente lentas. A SCSI,
que tem sido largamente implementada, seja talvez a melhor forma de exemplificar essas
limitações.
A consolidação de múltiplos tipos de servidores com múltiplas opções de
conectividade exige no mínimo de flexibilidade do sistema. A capacidade de uma única
plataforma Fibre Channel para lidar simultaneamente não apenas com conexões de canais
paralelos e seriais de mainframes, mas também com servidores de sistemas abertos SCSI e
Fibre Channel, permitem um excesso de conexões entre hosts mainframe e sistemas abertos.
3.6.2. Hardware
Talvez a parte mais importante para a implantação de uma SAN seja referente ao
hardware. É importante selecionar com cuidado os dispositivos de hardware para uma SAN,
pois há diferenças muito grande entre os equipamentos fornecidos por diferentes empresas do
ramo. Além disso, devido às SANs serem bastante dependentes de alguns softwares para
funcionar corretamente, é muito importante garantir as atualizações de softwares, firmwares e
outras questões ligadas à compatibilidade. Os fabricantes de equipamentos para SAN
costumam divulgar matrizes de compatibilidade para seus produtos em seus sites. Nelas há
uma quantidade muito grande de informações, contendo diversas combinações de hardware e
software, como storage,
4
switch,
5
HBA, servidor e sistema operacional, que foram
homologados pelo fabricante. Os principais componentes de hardware são:
4
5
Um dispositivo de rede que seleciona um caminho ou circuito para enviar dados entre destinos
Adaptador de barramento do host
10
Servidor de discos
Servidores de discos, também chamados de storages são dispositivos que
armazenam discos compartilhados pelos 6hosts da rede. Eles possuem, em geral, diversas
áreas diferentes, com esquemas de RAID diferentes ou discos específicos para a realização de
espelhamentos para backup, os chamados BCV (business continuance volumes). Os BCVs
facilitam muito tanto o backup quanto a restauração dos dados. O seu conteúdo é sincronizado
com o conteúdo do disco principal, até que se faça uma quebra do sincronismo, o chamado
split. Neste momento, o BCV guarda uma imagem do disco antes do split, e pode ser usado
para backup, enquanto o servidor continua trabalhando, sem impactos na produção. Este
procedimento pode ser feito com a freqüência mais conveniente para o usuário e, em muitos
casos, o BCV é utilizado também para restauração de dados perdidos, que é muito mais rápido
do que acessar fitas de backup.
Muitos storages, além de discos, possuem também uma espécie de processador e memórias,
onde é armazenado o 7firmware do equipamento.
Switches:
Switches fibre channel são bem mais complexos que os hubs, tanto em seu projeto
quanto em funcionalidade. Enquanto os hubs são apenas um concentrador de cabos para um
segmento compartilhado, um switch é um dispositivo de rápido roteamento dos dados e possui
uma taxa de transferência de dados exclusiva para cada porta. As taxas de transferência
variam bastante dependendo do switch, que vêm evoluindo rapidamente. Atualmente, a
velocidade
máxima
está
em
400
MB/s
para
cada
porta.
Enquanto os hubs não participam de atividades no nível do protocolo Fibre Channel, os
switches participam ativamente, tanto para fornecer serviços quanto para supervisionar o
fluxo de frames entre a origem e o destino.
6
7
Computador central. Também chamado de servidor ou nó.
Também conhecido como software embarcado, trata-se de um software que controla o hardware diretamente
11
HBA (Host Bus Adapter):
Uma HBA é um dispositivo capaz de conectar dispositivos externos a um servidor.
Por exemplo: para conectarmos um disco SCSI a um micro (barramento interno PCI), será
necessário utilizar uma HBA SCSI-PCI. No caso da SAN, é necessário instalar em todos os
servidores participantes dela uma HBA Fibre Channel, que se encarregará de fazer as
conversões
dos
diferentes
meios
internos
e
externos
ao
servidor.
As HBAs FC possuem, ainda, uma espécie de processador (um chip) capaz de fazer a
conversão de protocolos para poupar a CPU do servidor deste trabalho.
3.7.
Software
Um dos componentes indispensáveis para uma SAN são os softwares envolvidos.
Normalmente, as empresas fornecedoras de SAN são também produtoras de softwares que
gerenciam seus produtos de hardware. Embora não se tenha muitas pesquisas e estatísticas
que meçam o estado deste componente, a parte de software é um campo em expansão, como
pode ser visto em diversas empresas que vêm ampliando sua infra-estrutura de dados.
Estes softwares possuem diversas funções, entre elas:
Organizar o acesso às diferentes áreas do storage por parte dos servidores:
muitos storages hoje em dia possuem diferentes áreas de discos, que possuem controladoras
diferentes, além, de outras características diferentes, como, por exemplo, o esquema de RAID.
O planejamento do local no storage para alocar discos para os servidores, conforme suas
necessidades e características é muito importante, e os softwares atuais provêm cada vez mais
facilidades para este trabalho.
Prover diversos sistemas de contingência para o caso de falhas: como a maioria
dos dados em storage são críticos, há uma preocupação muito grande com um esquema de
contingência em caso de falhas. Um dos principais esquemas deste tipo é o chamado failover.
O failover é um termo genérico utilizado quando há redundância entre caminhos de acesso e,
caso haja falha em um deles, o outro é automaticamente acionado e passa a ser utilizado, o
que é controlado pelo software.
12
Aumentar a performance de acesso aos dados: há algumas ferramentas para
aumentar a performance de acesso aos dados em um software de um SAN, dependendo da
arquitetura utilizada. Uma muito utilizada é o balanceamento de carga (load balance), que
utiliza caminhos redundantes de acesso ao storage, e controla por software a melhor maneira
de acessá-lo, o que traz um grande aumento de performance.
Prover facilidades para o backup de servidores: quanto mais crítico um
servidor, mais complicado é o seu backup. Algumas aplicações não podem parar jamais e
possuem uma janela de backup muito pequena. Além disso, o backup não pode interferir na
performance do servidor, principalmente em casos de aplicações com alto índice de acesso.
Com ferramentas de software como o snapshot, é possível gravar imagens da área de discos
utilizadas pelo servidor, e fazer o backup em outro horário qualquer, sem impactar em nada a
produção. Isto é feito, em geral, guardando-se ponteiros para os dados e utilizando-se áreas
extras do storage para guardarem dados que sejam modificados após o snapshot, quando os
ponteiros que apontavam para a área original, passam a apontar para esta área temporária.
Normalmente, estes softwares possuem duas interfaces, uma gráfica, ou web, e outra
por linha de comando, o que é extremamente útil para a confecção de scripts para automatizar
alguns processos.
3.8.
RAID (Redundant Array of Independent Disks)
A maior parte das SANs atuais utiliza sistemas de 8RAID em seus principais
equipamentos de armazenamento de dados. Estes sistemas oferecem proteção dos dados,
tolerância à falhas, no caso de um componente ou um caminho de I/O falhar, alta
performance, capacidade de armazenamento e escalabilidade. Outras características para
garantir a confiabilidade dos sistemas de RAID mais modernos incluem redundância de
sistemas de refrigeração, fontes de alimentação, controladoras e até de circuitos de
monitoramento.
8
Redundant Array of Independent Disks, discos independentes de array redundante
13
A idéia do RAID é combinar múltiplos discos em uma matriz a fim de obter
características que discos isolados não poderiam fornecer como alto desempenho e tolerância
à falhas.
Os computadores conectados a um servidor RAID enxergam suas áreas como um
disco físico, que, para o servidor RAID é uma unidade lógica de armazenamento (Logical
Storage Unit - LUN).
Existem várias maneiras de obter as características de tolerância à falhas, redundância
dos dados e alta performance, que constituem os chamados níveis de RAID.
3.8.1. Raid 0
Os dados são distribuídos através dos discos, método conhecido por data striping, sem
gerar paridade ou redundância. A gravação e a leitura dos dados é feita paralelamente, uma
vez que cada disco possui a sua controladora. Com isto, há um grande ganho de performance,
porém, por não haver redundância alguma, se um dos discos falhar, os dados são perdidos.
RAID 0 é utilizado quando máxima performance é mais importante do que possíveis perdas
de dados.
II.
Exemplo de Raid 0
3.8.2. Raid 1
Os discos da matriz são divididos em 2 grupos. Na escrita, os dados são gravados
igualmente nos 2 grupos. Na leitura, os dados podem ser lidos de qualquer um dos grupos.
14
Normalmente, ela é feita alternando-se os discos, processo conhecido por 9round robin, mas
pode haver um disco preferencial para leitura, no caso de haver um disco mais rápido que
outro. Não há geração de paridade, mas sim uma redundância completa dos dados. Este
método tem se tornado popular pela sua simplicidade e praticidade em caso de falha de um
dos discos. Porém possui as desvantagens de utilizar apenas metade da capacidade total de
discos, além de não trazer nenhum aumento de performance.
III.
Exemplo de Raid 1
3.8.3. Raid 5
Este nível de RAID também utiliza o conceito de data striping, mas acrescenta uma
forma de obter redundância dos dados, através do gerador de paridade. Para cada escrita, é
gerada uma paridade calculada pela operação de ou exclusivo dos bits gravados. A paridade
fica espalhada pelos 3 discos, ou seja, a cada gravação ela é gravada em um disco diferente.
São necessários, no mínimo, 3 discos para sua implementação, sendo o espaço "desperdiçado"
do conjunto devido ao armazenamento da paridade é equivalente ao espaço de um disco.
Pode-se, com este esquema, perder até um disco que, a partir dos outros e da paridade,
reconstitui-se os dados do disco perdido. Caso mais de um disco falhe ao mesmo tempo, os
dados não poderão ser recuperados. É um método muito empregado nos storages atuais,
porque alia aumento de performance à segurança oferecida pela redundância com um ótimo
aproveitamento de recursos.
9
Round-Robin é um termo usado em tecnologia para indicar eventos que se alternam..
15
IV.
Exemplo de Raid 5
3.8.4. RAID 0 + 1 ou RAID 10
A combinação de níveis de RAID é uma prática comum hoje em dia. A mais utilizada
é a que combina os níveis 1 e 0, o que alia a alta performance do RAID 0 com a segurança
dos dados do RAID 1.
V.
3.9.
Exemplo de Raid 10
Gerenciamento da SAN
Hoje em dia, até mesmo os administradores inexperientes podem gerenciar uma SAN
de forma pró-ativa e segura e manter níveis ideais de serviço.
Existem no mercado vários softwares de gerenciamento, onde o escolhido para
demonstração é o VisualSAN Edition que fornece visibilidade de SAN física e lógica
completa e recursos que os administradores precisam para operar com eficiência.
O VisualSAN Edition oferece suporte a uma maior quantidade de portas e simplifica
ainda mais o trabalho administrativo. Ele acrescenta recursos de fornecimento automático de
armazenamento para host e percepção de aplicativos.
16
Usando uma comparação de configurações para isolar problemas e reduzindo a complexidade
e onde alguns alertas são emitidos para realizar ajustes rápidos.
3.10. Topologias
As SANs atuais são todas construídas em uma topologia física de estrela. Um switch é
conectado ao storage e neles conectamos todos os outros servidores da rede. A exceção fica
com a ligação ponto-a-ponto, como veremos a seguir.
Assim, analisaremos as topologias existentes:
Ligação ponto-a-ponto (point-to-point):
Para alguns não é considerada uma topologia de SAN, uma vez que não possui
escalabilidade alguma. Neste tipo de ligação, os servidores são ligados diretamente ao
storage, sem nenhum equipamento intermediário, como switch. O número máximo de
servidores envolvidos é igual ao número de portas que o storage possui. Comparado com a
ligação SCSI, no entanto, esta topologia, que utiliza Fibre Channel, apresenta uma
performance muito melhor e atinge distâncias maiores.
VI.
Exemplo de Ligação Ponto-a-ponto
17
Loops ou anéis: Fibre Channel Arbitrated Loop (FC-AL):
Nesta topologia utiliza-se hub, cuja largura de banda de no máximo de 100 MB/s é
compartilhada por todos os seus membros. Teoricamente suporta loops com até 126
dispositivos, mas na prática este número é bem menor. Esta topologia está sendo muito pouco
utilizada nas SANs modernas. Algumas pessoas comparam esta topologia como uma rede
Token Ring, em que a largura de banda é dividida por todos os dispositivos do loop.
Entretanto há equipamentos antigos que não suportam o modo fabric e, assim, é utilizado o
modo em loop.
VII.
Exemplo de TopologiaFC-AL
Malha (Switched fabric ou apenas fabric):
Nesta topologia, utiliza-se switches Fibre Channel, o que permite um grande número
de dispositivos interconectados. Dedica largura de banda integral a cada uma das portas e
permite transferências de dados simultaneamente para um único nó. É a topologia que permite
mais escalabilidade e crescimento. Teoricamente, pode conter mais de 7,7 milhões de nós.
18
VIII.
Exemplo de Topologia Fabric
Topologia mista:
Na literatura, encontramos, ainda, a possibilidade de combinar as duas topologias, o
que não é comum de se fazer:
IX.
Exemplo de Topologia Mista
19
4.
SAN X NAS
Vistas como concorrentes, as SANs – Storage Area Network e as NAS – Network
Attached Storage são tecnologias complementares: Enquanto as primeiras são otimizadas para
transferências de altos volumes de dados orientadas em bloco, as NAS oferecem acesso a
dados em nível de arquivo. Baseadas em protocolos abertos, como Fibre Channel e TCP/IP,
oferecem varias vantagens em relação ao sistema de armazenamento ligado ao servidor.
As SANs – Storage Area Networks e NAS – Network Attached Storage estão cada vez
mais substituindo ou complementando as tradicionais aplicações dedicadas a servidores em
muitos data centers.
Como resultado, as corporações estão obtendo muitos benefícios,
inclusive aumento de flexibilidade, instalação facilitada de sistemas de armazenamento e
redução geral de custos de armazenamento. Embora ambas as tecnologias possam oferecer
vantagens competitivas, cada uma é designada para tipos específicos de ambientes e
aplicações. [4]
Tab. I – Características das SANs e NAS
SAN
Protocolo
• Fibre Channel
• Fibre Channel para SCSI
Aplicações
• Processamento de aplicações de
banco de dados de missão critica.
• Backup de dados centralizado
• Operações de recuperação de
desastres
• Consolidação de armazenamento
Vantagens
•
•
•
•
•
•
•
•
Alta disponibilidade
Confiabilidade na transferência de
dados
Trafego reduzido na rede primaria
Flexibilidade de configuração
Alto desempenho
Alta escalabilidade
Gerenciamento centralizado
Oferta de múltiplos fornecedores
X.
NAS
•
TCP/IP
•
Compartilhameto de arquivo
em NFS e CIFS
Transferência de pequenos
blocos de dados a longas
distancias
Acesso ao banco de dados
limitado somente a leitura
•
•
•
•
•
Poucas limitações de
distancia
Adição simplificada da
capacidade de
compartilhamento de
arquivo
Fácil instalação e
menutenção
Tabela Comparativa entre as Tecnologias
20
5.
CONFIGURAÇÃO DO SISTEMA DE ARMAZENAMENTO
Block Diagram
Storage
Processor
Storage
Processor
CMI
Fibre Channel or
Gigabit Ethernet
Fibre Channel or
Gigabit Ethernet
Power supply
Mirrored cache
Fan
CPU
FC
SPS
Fan
Mirrored cache
Fan
Power supply
CPU
SPS
LCC
FC
LCC
XI.
LCC
LCC
LCC
LCC
Exemplo de Topologia Interna do Storage
Para maior confiabilidade, a arquitetura dos Storages mais modernos incluem dois
processadores ativos de armazenamento, cada um capaz de acessar de forma independente
todos os drives no array. Esse projeto garante as operações contínuas, por meio do failover
automatizado no caso de um processador de armazenamento tornar-se indisponível. Além
disso, o ambiente operacional de armazenamento proporciona à arquitetura flexibilidade
necessária para dar suporte a várias gerações de hardware e a diversos tipos de interconexões
com funcionalidade consistente, garantindo assim a proteção do investimento.[5]
O ambiente operacional de armazenamento fornece também a funcionalidade
avançada necessária para melhorar a relação custo/benefício e aumentar a disponibilidade de
aplicativos, por meio de diversos recursos como:
21
Grupos de LUNs que, por meio de striping ou concatenação, dão ao usuário
flexibilidade e controle do layout de dados no array.
Os metaLUNs melhoram o desempenho, permitindo que um volume englobe
um grande número de drives, além de possibilitar o uso mais eficiente da capacidade,
expandindo-a sem interrupções em qualquer local do array.
Movimentação dinâmica de dados entre drives FC e ATA, além de fornecer
recursos do tipo ILM( Information Lificycle Management) dentro de um único array Os
dados também podem ser movidos de um volume de um tipo de RAID para outro de um tipo
diferente, atendendo aos requisitos de desempenho de um aplicativo específico.
Alem de alta disponibilidade em todos os dispositivos de hardware como:
Cache de gravação, sendo que cada processador de armazenamento contém os
principais dados em cache dos seus LUNs, bem como uma cópia secundária do cache do
processador de armazenamento de mesmo nível.
Bateria de reserva para controladores e discos com compartimentos de cache, o
que permite um desligamento ordenado, de forma a garantir a proteção em caso de uma falha
de energia.
Proteção de RAID nos níveis 1/0, 0, 1, 3 e 5, todos podendo existir
simultaneamente no mesmo array para atender aos diferentes requisitos de proteção dos
dados.
22
6.
CONCLUSÃO
A SAN é hoje uma alternativa para suprir as necessidades de armazenamento de
dados, que por sua vez deve ser analisada de forma real, pois ainda se trata de uma solução
cara para as empresas.
As empresas devem entender bem o conceito dessa nova rede de armazenamento e
procurar não usar apenas o hardware dessa solução, mas todo o conjunto que se baseia no
software e serviços de implementação dessa solução.
Os acessos aos recursos da rede são dinâmicos, uma vez que todos os recursos estão
disponíveis para a rede como um todo e não ligados fisicamente a um servidor, beneficiando a
criação de sistemas de redundâncias .
Com a centralização das informações, facilitando a administração, bem como cuidar
da segurança, além de se ter uma rede com escalabilidade, flexibilidade, disponibilidade e
menos tempo de 10downtime .
Não podemos confundir problemas de espaço com problemas de não se ter regras com
o que se armazena nos servidores hoje em dia, pois não adianta ter um sistema eficaz e
eficiente disponível e continuar sem regras sobre o que se deve armazenar.
Tudo que as pessoas precisam fazer na rede é alimentado por dados, voltado para
dados e dependente de dados. Enquanto a utilização da rede aumenta, você precisa ter certeza
de que terá a capacidade de armazenagem de dados confiável e de alto desempenho de que vai
precisar - no momento em que precisar dela. A STORAGE AREA NETWORK, surgiu como
uma alternativa simples e eficiente para ser usada nesse momento e deve ser o padrão de tipo
de armazenamento dos próximos anos.
10
Tempo de parada de aplicações e servidores críticos.
23
Referência Bibliográfica
[1] EMC Brasil Inc .URL: http://www.emc2.com.br. Recuperado em 10/10/2005, 15:00.
[2] Storage Networking Industry Association. URL: http://www.snia.org/. Recuperado em
20/04/2005, 21:00.
[3] URL: http://www.fibrechannel.org/. Recuperado em 10/04/2005, 15:40
[4] URL: http://www.nas-san.com. Recuperado em 01/09/2005, 20:35.
[5] NEMETH, Evi.; SNYDER, Garth.; SEEBASS, Scott.; HEIN, Trent R. Manual de
Administração do Sistema UNIX, 3a edição
24
Bibliografia Consultada
http://www.dothill.com/tutorial/index.htm. Recuperado em 01/04/2005, 13:52
http://eval.veritas.com/webfiles/docs/san-whitepaper.pdf. Recuperado em 03/04/2005, 22:10.
http://www.qlogic.com/documents/datasheets/knowledge_data/whitepapers/whitepapers.zonin
g.pdf. Recuperado em 10/04/2005, 15:30.
http://www.networkcomputing.com/1109/1109ws1.html. Recuperado em 10/04/2005, 15:30.
http://www.networkmagazine.com/shared/article/showArticle.jhtml?articleId=17601008&pgn
o=2. Recuperado em 20/04/2005, 21:00.
http://www.sun.com/storage/white-papers/fc_comp.html. Recuperado em 01/09/2005, 20:35.
http://www.ibm.com. Recuperado em 10/10/2005, 16:00.
http://www.hitachi.com. Recuperado em 20/09/2005, 22:00
http://www.hp.com. Recuperado em 20/09/2005,22:00.
.
Download

FACULDADE DE TECNOLOGIA PADRE ANCHIETA Curso de