FACULDADE DE TECNOLOGIA PADRE ANCHIETA Curso de SISTEMAS DE INFORMAÇÃO ARMAZENAMENTO DE DADOS: STORAGE AREA NETWORK Mariana Monteiro Monografia apresentada à disciplina Projeto de Final de Curso, do Curso de Sistemas de Informação da Faculdade de Tecnologia Padre Anchieta, sob a orientação do Prof. Carlos Eduardo Câmara, como exigência parcial para conclusão do curso de graduação. Orientador: Prof. Carlos Eduardo Câmara Jundiaí – São Paulo – Brasil 11/2005 ii Armazenamento de dados: Storage Area Network Mariana Monteiro Monografia defendida e aprovada em 01 de dezembro de 2005 pela Banca Examinadora assim constituída: Prof Ms/Dr Carlos Eduardo Câmara (Orientador) FATEPA – Faculdade de Tecnologia Padre Anchieta – Jundiaí – SP. Prof Ms/Dr Marcos Paulo Rebello (Membro Interno) FATEPA – Faculdade de Tecnologia Padre Anchieta – Jundiaí – SP. Prof Ms Vanderlei Ienne (Membro Externo) UNICAMP – Universidade Estadual de Campinas – Campinas – SP. iii Deus marcou o tempo certo para cada coisa. Ele nos deu o desejo de entender as coisas que já aconteceram e as que ainda vão acontecer, porém não nos deixa compreender completamente o que ele faz. Então entendi que nesta vida tudo o que a pessoa pode fazer é procurar ser feliz e viver o melhor que puder. (Eclesiastes 3:11-12) iv A meus amigos, sem os quais não chegaria até aqui, em especial Weber Abreu, Eduardo Ogura, Vitor Martins e Gerson Freire. A meus tios Luciano e Adriana pela ajuda em todos os sentidos. A meu namorado Bruno que sempre esteve presente nas horas mais difíceis. A minha mãe, pelo cumprimento fiel e perfeito de seu papel, cercando de carinho e incentivo todas as atitudes da minha vida. Aos meus cachorros Gugu e Bob, a quem tantas horas de brincadeiras adiadas sem que estes compreendessem o porquê. Agradeço em especial á Deus, pelos desafios lançados durante este período. Sou eternamente grata a todos. v AGRADECIMENTOS Agradeço a Deus, em primeiro lugar, pela força e luz recebida nos meus maiores momentos de dificuldades. Agradeço ao Professor Carlos Eduardo Câmara, orientador, que acreditou em mim e incentivou-me para a conclusão deste trabalho, face aos inúmeros percalços do trajeto. Alguns experimentos e vários “entendimentos” não teriam sido possíveis sem a colaboração de Eduardo Ogura, Gerson Freire e Weber Abreu. Eu agradeço fraternalmente a todos. vi SUMÁRIO AGRADECIMENTOS ............................................................................................................................................. v SUMÁRIO ................................................................................................................................................................ vi Lista de Siglas.......................................................................................................................................................... vii Lista de Figuras......................................................................................................................................................viii RESUMO .................................................................................................................................................................. ix ABSTRACT.............................................................................................................................................................. ix 1. INTRODUÇÃO ............................................................................................................................................... 1 2. STORAGE: ARMAZENAMENTO DE DADOS......................................................................................... 2 3. TIPOS DE TOPOLOGIAS ............................................................................................................................ 3 3.1. DAS :Direct Attached Storage ................................................................................................................ 3 3.2. NAS: Network Attached Storage............................................................................................................. 4 3.3. SAN: Storage Area Network ................................................................................................................... 4 3.4. História.................................................................................................................................................... 6 3.5. Benefícios da Tecnologia SAN................................................................................................................ 7 3.6. Protocolos................................................................................................................................................ 8 3.6.1. Fibre Channel..................................................................................................................................... 8 3.6.2. Hardware............................................................................................................................................ 9 3.7. Software ................................................................................................................................................. 11 3.8. RAID (Redundant Array of Independent Disks) ................................................................................... 12 3.8.1. Raid 0................................................................................................................................................ 13 3.8.2. Raid 1................................................................................................................................................ 13 3.8.3. Raid 5................................................................................................................................................ 14 3.8.4. RAID 0 + 1 ou RAID 10 .................................................................................................................. 15 3.9. Gerenciamento da SAN ......................................................................................................................... 15 3.10. Topologias ............................................................................................................................................. 16 4. SAN X NAS .................................................................................................................................................... 19 5. CONFIGURAÇÃO DO SISTEMA DE ARMAZENAMENTO.............................................................. 20 6. CONCLUSÃO ............................................................................................................................................... 22 Referência Bibliográfica........................................................................................................................................ 23 Bibliografia Consultada ......................................................................................................................................... 24 vii Lista de Siglas DAS….. ........................................................................Direct Attached Storage NAS ..............................................................................Network Attached Storage SAN .............................................................................Storage Area Network LAN ..............................................................................Local Area Network WAN.............................................................................Wide Area Network Storage..........................................................................Armazenamento FC .................................................................................Fibre Channel Cabling..........................................................................Cabeamento Hba................................................................................Host Based Adapter Raid...............................................................................Redundante Tools of Management ...................................................Ferramentas de Gerenciamento Servers ..........................................................................Servidores Operating Systems ........................................................Sistemas Operacionais Data...............................................................................Dados Information ...................................................................Informação viii Lista de Figuras I. Exemplo de SAN.............................................................................................................................................. 5 II. Exemplo de Raid 0 ........................................................................................................................................ 13 III. Exemplo de Raid 1 ........................................................................................................................................ 14 IV. Exemplo de Raid 5 ........................................................................................................................................ 15 V. Exemplo de Raid 10 ...................................................................................................................................... 15 VI. Exemplo de Ligação Ponto-a-ponto ............................................................................................................ 16 VII. Exemplo de TopologiaFC-AL...................................................................................................................... 17 VIII. Exemplo de Topologia Fabric...................................................................................................................... 18 IX. Exemplo de Topologia Mista ....................................................................................................................... 18 X. Tabela Comparativa entre as Tecnologias................................................................................................. 19 XI. Exemplo de Topologia Interna do Storage................................................................................................. 20 ix RESUMO Storage Area Network ou rede de armazenamento de dados é uma rede de alta velocidade dedicada a fornecer benefícios diversos relacionados ao acesso a dados. Vem popularizando-se enormemente no meio corporativo nos últimos anos por trazer vantagens como altas taxas de transferência para o acesso aos dados, redundâncias que garantem a continuidade dos negócios em caso de falhas e facilidade para aumentar o espaço em disco destinado aos servidores integrantes da rede. Este trabalho tem por objetivo explicar os fundamentos básicos que compõem uma SAN, assunto de bibliografia ainda escassa, a fim de que todos conheçam esta tecnologia que vem sendo cada vez mais adotada por empresas em todo o mundo. ABSTRACT Storage Area Network is a high-speed network design to provide fast and reliable access to the data. It is becoming more and more common on IT environments because its advantage, such as great transfers rates, high availability for business continuance and scalability to grow the storage to the hosts. This assignment has the goal to explain the foundations of a SAN (issue with a rare study material) for all to get to know this technology that has been adopted for companies around the world. 1 1. INTRODUÇÃO Nas últimas duas décadas conhecemos a descentralização tanto do armazenamento de dados e informações quanto do processamento destas, com a proliferação de redes locais e servidores. Parecia de fato uma grande idéia, até que nos descobrimos envolvidos por inúmeras ilhas tecnológicas. O cenário distribuído trouxe, em conseqüência, uma descentralização do armazenamento das informações. A falta de controle deste ambiente está levando às altas taxas de crescimento de Terabytes (TB), ao mesmo tempo em que continuam ocorrendo, com mais incidência, problemas de 1disk full e dificuldades de se localizar determinada informação. Além disso, essas informações não possuem cópias, muito menos replicação em lugares distintos. Em que servidor e em que banco de dados ou arquivos se encontra tal informação? E quando a informação se encontra em estações de trabalho? Dentro de poucos meses, um PC poderá ter discos de mais de 200GB e se supormos uma empresa com mil destas maquinas, teremos mais de 200.000GB de espaço sem controle de seu conteúdo. Este crescimento apenas aumenta a dificuldade de gerenciamento. Está claro que este modelo de armazenamento de dados está alcançando seus limites. O que precisamos é de um novo modelo que nos permita, de modo fácil, e gerenciável, administrar as informações. A necessidade básica é a consolidação das informações de toda a empresa em um determinado local, permitindo que todos compartilhem estas informações, diminuindo significativamente os custos de gerenciamento e tornando a informação ema real vantagem competitiva. Esse novo modelo já existe, é chamado Storage Area Network (SAN), que resumindo o conceito numa infra-estrutura de fibra que permite o compartilhamento de unidades de disco e banda por vários sistemas heterogêneos que também participam nessa infra-estrutura. Uma rede de propósito especial e de alta velocidade que conecta diferentes dispositivos de armazenamento a servidores. As redes SAN podem oferecer recursos de armazenamento para backup e arquivamento para localidades múltiplas e remotas. Um grupo de serviços de armazenamento de dados ligados com um servidor ou estação gráfica host, freqüentemente através de switches, utilizando a tecnologia Fibre Channel. A SAN traz benefícios imediatos á uma empresa, como a redução do custo utilizados para gerir e proteger dados, a melhora do acesso aos dados, o aumento da capacidade de armazenamento e escalabilidade. 1 Termo utilizado quando o disco rígido está completo com dados 2 2. STORAGE: ARMAZENAMENTO DE DADOS Storage, de modo simplista, é armazenamento de dados. Os dados podem ser armazenados de diversas maneiras, dos modos mais primitivos até ao que há de melhor em tecnologia de armazenamento de dados. Guardar documentos impressos em papel, informações anotadas em cadernos, enciclopédias... tudo isso são formas de se armazenar dados, também chamados de informação. Porém, quando falamos de storage, falamos no armazenamento de grandes quantidades de dados de corporações em geral, visando à segurança, disponibilidade e fácil acesso e gerenciamento. Falamos de grandes infra-estruturas de armazenamento que visam o mercado corporativo, oferecendo elevados níveis de segurança, performance, disponibilidade, em casos até mesmo de desastres inesperados. Storage não é somente armazenar é também: Servir (aplicações, usuários, serviços…). Disponibilizar (sistemas que não param!). Proteger (informações que não podem ser perdidas) Gerenciar (recursos, investimentos, crescimento…). Flexibilizar (crescimento, recursos, investimentos…). Hoje os sistemas de storage não são vistos apenas do ponto de vista técnico e tecnológico e sim como ferramenta essencial para o crescimento das corporações, continuidade de negócios, redução de custos e investimentos, além, claro de melhores resultados e maiores lucros. 3 3. TIPOS DE TOPOLOGIAS Os Subsistemas de Discos são sistemas inteligentes que agregam grandes quantidades de discos e softwares, formando grandes repositórios de dados com grandes, porém variáveis níveis de proteção. [1] Entre suas características estão vantagens como a redundância total do hardware, através de fontes e ventiladores redundantes, memória cache espelhada, placas processadoras redundantes, níveis de RAID e caminhos duplos de fibra. Além disso, contam com sistemas de proteção via software, como 2snapshots, volumes espelhados e sites espelhos remotos. Subsistemas de Discos oferecem também toda a centralização e consolidação dos dados da empresa, aumentando a performance, melhorando e centralizando o gerenciamento da infra-estrutura e da informação, consolidando servidores e reduzindo custos. Os Subsistemas de Discos podem ser conectados de três maneiras diferentes: 1) 2) 3) DAS- Direct Attached Storage NAS- Network Attached Storage SAN-Storage Area Network 3.1. DAS :Direct Attached Storage Nesta topologia os servidores são conectados diretamente ao subsistema de discos. Mesmo que exista mais de um servidor conectado diretamente ao subsistema, se não houver um dispositivo de rede no caminho ainda assim trata-se de uma topologia DAS (Storage conectado diretamente). 2 Fotografia de determinada área de disco 4 3.2. NAS: Network Attached Storage Um NAS ou Network Attached Storage é uma unidade ou servidor de armazenamento que se liga como qualquer outro servidor à rede da empresa, onde tem a função de servidor de arquivos. Um servidor NAS entende vários protocolos de rede, adapta-se a vários tipos de rede e sabe dialogar com sistemas como UNIX, NT ou Netware. Um dispositivo NAS combina a tecnologia dos 3arrays de discos com a inteligência de uma pequena unidade de processamento. É comum a familiaridade com o conceito de “impressora de rede”, ou seja, aquela onde o usuário pode imprimir. Do mesmo modo o NAS é uma unidade partilhada através da LAN e todos os usuários com os direitos e permissões de acessos adequados podem montar sistemas de arquivos diretamente sem ter que veicular os dados através do servidor. [1] 3.3. SAN: Storage Area Network Uma SAN é de modo simplificado, uma rede dedicada ao armazenamento de dados, que conecta dispositivos armazenadores de discos conhecidos por storages aos servidores da rede. É uma tecnologia relativamente nova e que vem se popularizando bastante no meio corporativo nos últimos anos, trazendo cada vez mais benefícios para as empresas que a adotam. O mercado brasileiro de armazenamento de dados cresceu 44,4% em 2003, com uma movimentação no setor de 1,3 bilhões de dólares. No mundo, este mercado movimentou 25,5 bilhões de dólares em 2003. As perspectivas para 2004 são ainda maiores. [2] Em linhas gerais, pode-se definir SAN como uma infra-estrutura que permite que diversos servidores tenham acesso a discos externos de modo rápido e confiável. O conceito de discos externos já é, há algum tempo, uma tendência mundial, e vem sendo cada vez mais adotado. Os discos externos não são limitados em espaço como um disco interno, são mais fáceis de manusear quando necessário e trazem facilidades para o compartilhamento por 3 Agrupamento de elementos 5 vários servidores. A figura central de uma SAN, de fato, é o servidor de discos ou, como é popularmente conhecido, o storage. A centralização das operações de armazenamento de dados e seu gerenciamento são as razões principais pela popularização das SANs. Administrar todos os recursos de armazenamento em ambientes críticos e de crescimento elevado não é uma tarefa fácil e pode ser muito dispendioso. Imagine, por exemplo, uma empresa com centenas de servidores que possuem importante demanda por espaço em disco. Acompanhar máquina a máquina e gerenciar seus volumes, com certeza não será um tarefa fácil. Com a centralização oferecida pela SAN, tanto o tempo quanto o custo de gerenciamento destes ambientes é muito reduzido. Além disso, uma SAN provê uma série de outras vantagens para o acesso a áreas de discos, como sua alta escalabilidade e confiabilidade. Uma SAN é implementada utilizando-se componentes de hardware e também importantes softwares, sem os quais a SAN não traria tantos benefícios quanto conhecemos hoje. Como veremos no decorrer deste trabalho o conjunto de hardware e software certo é que vai definir a qualidade da SAN. Abaixo, vemos uma SAN, representada por uma nuvem e diversos de seus equipamentos, ao lado de outras redes. A figura nos dá uma idéia de como as tecnologias não são isoladas, mas se integram. I. Exemplo de SAN 6 3.4. História A idéia da SAN nasceu em 1987, quando Patterson, Gibson e Katz, da Universidade da Califórnia, publicaram o artigo A Case for Redundant Arrays of Inexpensive Disks (RAID). As idéias apresentadas e explicadas no artigo sugeriam combinar vários discos de pequeno porte, não muito caros, em uma matriz a fim de obter características que discos isolados não eram capazes de oferecer. Estas novas características tratavam, principalmente, de melhorar a performance de leitura e escrita e preservar automaticamente o conteúdo dos discos durante e depois da falha de componentes do disco. Com os discos em RAID, nasceram os servidores de discos, os storages, que são o centro de uma SAN. Um acontecimento que também foi muito importante para o surgimento desta arquitetura foi o desenvolvimento do padrão Fibre Channel (FC), utilizado nas SANs. Fibre Channel é um protocolo de transferência de dados, que faz uso do meio físico de fibra ótica. Acompanhando o processo de popularização das SANs, os diferentes fornecedores começaram a tentar definir seus próprios padrões FC, o que estava atrapalhando o desenvolvimento do padrão. Assim, foram criadas algumas organizações para definir as regras para o novo padrão. Entre elas, destacam-se a FCIA (Fibre Channel Industry Organization) e a SNIA (Storage Networking Industry Association). A FCIA foi criada em agosto de 1999, da fusão da Fibre Channel Association e Fibre Channel Community. É uma organização de benefício mútuo, sem fins lucrativos, formada por fabricantes, integradores de sistemas, desenvolvedores, vendedores, profissionais da indústria e usuários. O objetivo da FCIA é criar bases para a tecnologia de infra-estrutura FC, a fim de que várias aplicações dentro dos complicados mercados de Storage e TI possam ser suportadas. [2] A SNIA foi criada em Dezembro de 1997 ,é uma associação sem fins lucrativos que dedica-se a garantir que as redes de armazenamento de dados tornem-se soluções completas e confiáveis dentro da comunidade de tecnologia.[2] 7 3.5. Benefícios da Tecnologia SAN Podem-se citar como principais benefícios proporcionados por uma arquitetura de SAN: Alta performance no acesso aos dados: as taxas de transferência nas SAN mais modernas podem chegar a até 2 Gbp/s. Além disso, dependendo do arranjo dos discos (RAID), pode haver grande ganho de performance na leitura e/ou escrita, como veremos adiante neste trabalho; Alta disponibilidade e confiabilidade: uma SAN possui diversas formas de aumentar a disponibilidade dos dados de modo que, mesmo em caso de falha de alguns discos, a produção na seja interrompida. Opções como caminhos redundantes para acesso aos dados e espelhamento de dados em tempo real pode assegurar a disponibilidade dos dados e aplicações. Escalabilidade: capacidade de adicionar mais capacidade de armazenamento e outros recursos à infra-estrutura já existente. Isto é feito facilmente dentro de uma SAN, freqüentemente sem a necessidade de desligar o(s) servidor(s) ou seus clientes de rede; Centralizar a administração dos recursos: nos ambientes atuais, cada vez mais complexos, isto pode ser a única solução para a administração dos recursos de discos, trazendo grandes economias para as empresas. Descongestionamento da LAN: em muitos casos a rede local é lenta devido ao grande fluxo de informações que trafega por ela. Com uma SAN, este fluxo é bastante reduzido, o que alivia a rede local, beneficiando os usuários. Isto também é muito importante para o backup corporativo, que também pode ser feito sem utilizar a rede local. Além destes ganhos, há outros que variam um pouco dependendo da solução adotada e dos fornecedores escolhidos, tal como balanceamento de carga e facilidades para backup. Estas facilidades focam em alternativas para aplicações em que não há janela para backup disponível, já que elas exigem disponibilidade integral. 8 3.6. Protocolos SANs podem ser implementadas utilizando interfaces, de diferentes tipos. Os protocolos suportados por SAN são os seguintes: FCP: Fibre Channel Protocol FCIP: Fibre Channel sobre TCP/IP IFCP: Internet Fibre Channel Protocol SCSI: Small Computer System Interface ISCSI: Internet Small Computer System Interface ISNS: Internet Storage Name Service SAS: Serial Attached SCSI Atualmente, Fibre Channel é o padrão utilizado na maioria das SANs. 3.6.1. Fibre Channel A tecnologia Fibre Channel está se tornando o elemento chave para viabilizar uma Storage Network. As características do Fibre Channel permitem que topologias do tipo de redes possa ser aplicadas no ambiente de armazenamento de dados como a base do paradigma emergem do Storage Network. [3] O surgimento de plataformas que empregam componentes de rede com base no Fibre Channel, tais como hubs e switches, oferecem melhorias dramáticas na forma com que as empresas gerenciam, protegem e compartilham volumes crescentes de informações com missão crítica. O Fibre Channel oferece vários benefícios para os servidores de armazenamento de informações: distância maior entre os sistemas, consolidação de dados, conectividade aberta e maior taxa de transferência de dados. O Fibre Channel permite interligar servidores e sistemas de armazenamento de dados através de distâncias maiores. As atuais implementações de SCSI impõem uma limitação na distância de apenas 25 metros entre os servidores e os sistemas de armazenamento de dados. 9 O Fibre Channel permite que os dispositivos da rede de Storage possam ser separados por distâncias de até 10 km, ou seja, 400 vezes com relação à SCSI. [3] A conectividade Fibre Channel permite que as organizações possam consolidar dados entre servidores e sistemas de armazenamento de dados bastante dispersos, e ao mesmo tempo, dar suporte para os crescentes volumes e tipos de dados corporativos. Até agora, a conectividade era restrita a esquemas de conexão ponto-a-ponto relativamente lentas. A SCSI, que tem sido largamente implementada, seja talvez a melhor forma de exemplificar essas limitações. A consolidação de múltiplos tipos de servidores com múltiplas opções de conectividade exige no mínimo de flexibilidade do sistema. A capacidade de uma única plataforma Fibre Channel para lidar simultaneamente não apenas com conexões de canais paralelos e seriais de mainframes, mas também com servidores de sistemas abertos SCSI e Fibre Channel, permitem um excesso de conexões entre hosts mainframe e sistemas abertos. 3.6.2. Hardware Talvez a parte mais importante para a implantação de uma SAN seja referente ao hardware. É importante selecionar com cuidado os dispositivos de hardware para uma SAN, pois há diferenças muito grande entre os equipamentos fornecidos por diferentes empresas do ramo. Além disso, devido às SANs serem bastante dependentes de alguns softwares para funcionar corretamente, é muito importante garantir as atualizações de softwares, firmwares e outras questões ligadas à compatibilidade. Os fabricantes de equipamentos para SAN costumam divulgar matrizes de compatibilidade para seus produtos em seus sites. Nelas há uma quantidade muito grande de informações, contendo diversas combinações de hardware e software, como storage, 4 switch, 5 HBA, servidor e sistema operacional, que foram homologados pelo fabricante. Os principais componentes de hardware são: 4 5 Um dispositivo de rede que seleciona um caminho ou circuito para enviar dados entre destinos Adaptador de barramento do host 10 Servidor de discos Servidores de discos, também chamados de storages são dispositivos que armazenam discos compartilhados pelos 6hosts da rede. Eles possuem, em geral, diversas áreas diferentes, com esquemas de RAID diferentes ou discos específicos para a realização de espelhamentos para backup, os chamados BCV (business continuance volumes). Os BCVs facilitam muito tanto o backup quanto a restauração dos dados. O seu conteúdo é sincronizado com o conteúdo do disco principal, até que se faça uma quebra do sincronismo, o chamado split. Neste momento, o BCV guarda uma imagem do disco antes do split, e pode ser usado para backup, enquanto o servidor continua trabalhando, sem impactos na produção. Este procedimento pode ser feito com a freqüência mais conveniente para o usuário e, em muitos casos, o BCV é utilizado também para restauração de dados perdidos, que é muito mais rápido do que acessar fitas de backup. Muitos storages, além de discos, possuem também uma espécie de processador e memórias, onde é armazenado o 7firmware do equipamento. Switches: Switches fibre channel são bem mais complexos que os hubs, tanto em seu projeto quanto em funcionalidade. Enquanto os hubs são apenas um concentrador de cabos para um segmento compartilhado, um switch é um dispositivo de rápido roteamento dos dados e possui uma taxa de transferência de dados exclusiva para cada porta. As taxas de transferência variam bastante dependendo do switch, que vêm evoluindo rapidamente. Atualmente, a velocidade máxima está em 400 MB/s para cada porta. Enquanto os hubs não participam de atividades no nível do protocolo Fibre Channel, os switches participam ativamente, tanto para fornecer serviços quanto para supervisionar o fluxo de frames entre a origem e o destino. 6 7 Computador central. Também chamado de servidor ou nó. Também conhecido como software embarcado, trata-se de um software que controla o hardware diretamente 11 HBA (Host Bus Adapter): Uma HBA é um dispositivo capaz de conectar dispositivos externos a um servidor. Por exemplo: para conectarmos um disco SCSI a um micro (barramento interno PCI), será necessário utilizar uma HBA SCSI-PCI. No caso da SAN, é necessário instalar em todos os servidores participantes dela uma HBA Fibre Channel, que se encarregará de fazer as conversões dos diferentes meios internos e externos ao servidor. As HBAs FC possuem, ainda, uma espécie de processador (um chip) capaz de fazer a conversão de protocolos para poupar a CPU do servidor deste trabalho. 3.7. Software Um dos componentes indispensáveis para uma SAN são os softwares envolvidos. Normalmente, as empresas fornecedoras de SAN são também produtoras de softwares que gerenciam seus produtos de hardware. Embora não se tenha muitas pesquisas e estatísticas que meçam o estado deste componente, a parte de software é um campo em expansão, como pode ser visto em diversas empresas que vêm ampliando sua infra-estrutura de dados. Estes softwares possuem diversas funções, entre elas: Organizar o acesso às diferentes áreas do storage por parte dos servidores: muitos storages hoje em dia possuem diferentes áreas de discos, que possuem controladoras diferentes, além, de outras características diferentes, como, por exemplo, o esquema de RAID. O planejamento do local no storage para alocar discos para os servidores, conforme suas necessidades e características é muito importante, e os softwares atuais provêm cada vez mais facilidades para este trabalho. Prover diversos sistemas de contingência para o caso de falhas: como a maioria dos dados em storage são críticos, há uma preocupação muito grande com um esquema de contingência em caso de falhas. Um dos principais esquemas deste tipo é o chamado failover. O failover é um termo genérico utilizado quando há redundância entre caminhos de acesso e, caso haja falha em um deles, o outro é automaticamente acionado e passa a ser utilizado, o que é controlado pelo software. 12 Aumentar a performance de acesso aos dados: há algumas ferramentas para aumentar a performance de acesso aos dados em um software de um SAN, dependendo da arquitetura utilizada. Uma muito utilizada é o balanceamento de carga (load balance), que utiliza caminhos redundantes de acesso ao storage, e controla por software a melhor maneira de acessá-lo, o que traz um grande aumento de performance. Prover facilidades para o backup de servidores: quanto mais crítico um servidor, mais complicado é o seu backup. Algumas aplicações não podem parar jamais e possuem uma janela de backup muito pequena. Além disso, o backup não pode interferir na performance do servidor, principalmente em casos de aplicações com alto índice de acesso. Com ferramentas de software como o snapshot, é possível gravar imagens da área de discos utilizadas pelo servidor, e fazer o backup em outro horário qualquer, sem impactar em nada a produção. Isto é feito, em geral, guardando-se ponteiros para os dados e utilizando-se áreas extras do storage para guardarem dados que sejam modificados após o snapshot, quando os ponteiros que apontavam para a área original, passam a apontar para esta área temporária. Normalmente, estes softwares possuem duas interfaces, uma gráfica, ou web, e outra por linha de comando, o que é extremamente útil para a confecção de scripts para automatizar alguns processos. 3.8. RAID (Redundant Array of Independent Disks) A maior parte das SANs atuais utiliza sistemas de 8RAID em seus principais equipamentos de armazenamento de dados. Estes sistemas oferecem proteção dos dados, tolerância à falhas, no caso de um componente ou um caminho de I/O falhar, alta performance, capacidade de armazenamento e escalabilidade. Outras características para garantir a confiabilidade dos sistemas de RAID mais modernos incluem redundância de sistemas de refrigeração, fontes de alimentação, controladoras e até de circuitos de monitoramento. 8 Redundant Array of Independent Disks, discos independentes de array redundante 13 A idéia do RAID é combinar múltiplos discos em uma matriz a fim de obter características que discos isolados não poderiam fornecer como alto desempenho e tolerância à falhas. Os computadores conectados a um servidor RAID enxergam suas áreas como um disco físico, que, para o servidor RAID é uma unidade lógica de armazenamento (Logical Storage Unit - LUN). Existem várias maneiras de obter as características de tolerância à falhas, redundância dos dados e alta performance, que constituem os chamados níveis de RAID. 3.8.1. Raid 0 Os dados são distribuídos através dos discos, método conhecido por data striping, sem gerar paridade ou redundância. A gravação e a leitura dos dados é feita paralelamente, uma vez que cada disco possui a sua controladora. Com isto, há um grande ganho de performance, porém, por não haver redundância alguma, se um dos discos falhar, os dados são perdidos. RAID 0 é utilizado quando máxima performance é mais importante do que possíveis perdas de dados. II. Exemplo de Raid 0 3.8.2. Raid 1 Os discos da matriz são divididos em 2 grupos. Na escrita, os dados são gravados igualmente nos 2 grupos. Na leitura, os dados podem ser lidos de qualquer um dos grupos. 14 Normalmente, ela é feita alternando-se os discos, processo conhecido por 9round robin, mas pode haver um disco preferencial para leitura, no caso de haver um disco mais rápido que outro. Não há geração de paridade, mas sim uma redundância completa dos dados. Este método tem se tornado popular pela sua simplicidade e praticidade em caso de falha de um dos discos. Porém possui as desvantagens de utilizar apenas metade da capacidade total de discos, além de não trazer nenhum aumento de performance. III. Exemplo de Raid 1 3.8.3. Raid 5 Este nível de RAID também utiliza o conceito de data striping, mas acrescenta uma forma de obter redundância dos dados, através do gerador de paridade. Para cada escrita, é gerada uma paridade calculada pela operação de ou exclusivo dos bits gravados. A paridade fica espalhada pelos 3 discos, ou seja, a cada gravação ela é gravada em um disco diferente. São necessários, no mínimo, 3 discos para sua implementação, sendo o espaço "desperdiçado" do conjunto devido ao armazenamento da paridade é equivalente ao espaço de um disco. Pode-se, com este esquema, perder até um disco que, a partir dos outros e da paridade, reconstitui-se os dados do disco perdido. Caso mais de um disco falhe ao mesmo tempo, os dados não poderão ser recuperados. É um método muito empregado nos storages atuais, porque alia aumento de performance à segurança oferecida pela redundância com um ótimo aproveitamento de recursos. 9 Round-Robin é um termo usado em tecnologia para indicar eventos que se alternam.. 15 IV. Exemplo de Raid 5 3.8.4. RAID 0 + 1 ou RAID 10 A combinação de níveis de RAID é uma prática comum hoje em dia. A mais utilizada é a que combina os níveis 1 e 0, o que alia a alta performance do RAID 0 com a segurança dos dados do RAID 1. V. 3.9. Exemplo de Raid 10 Gerenciamento da SAN Hoje em dia, até mesmo os administradores inexperientes podem gerenciar uma SAN de forma pró-ativa e segura e manter níveis ideais de serviço. Existem no mercado vários softwares de gerenciamento, onde o escolhido para demonstração é o VisualSAN Edition que fornece visibilidade de SAN física e lógica completa e recursos que os administradores precisam para operar com eficiência. O VisualSAN Edition oferece suporte a uma maior quantidade de portas e simplifica ainda mais o trabalho administrativo. Ele acrescenta recursos de fornecimento automático de armazenamento para host e percepção de aplicativos. 16 Usando uma comparação de configurações para isolar problemas e reduzindo a complexidade e onde alguns alertas são emitidos para realizar ajustes rápidos. 3.10. Topologias As SANs atuais são todas construídas em uma topologia física de estrela. Um switch é conectado ao storage e neles conectamos todos os outros servidores da rede. A exceção fica com a ligação ponto-a-ponto, como veremos a seguir. Assim, analisaremos as topologias existentes: Ligação ponto-a-ponto (point-to-point): Para alguns não é considerada uma topologia de SAN, uma vez que não possui escalabilidade alguma. Neste tipo de ligação, os servidores são ligados diretamente ao storage, sem nenhum equipamento intermediário, como switch. O número máximo de servidores envolvidos é igual ao número de portas que o storage possui. Comparado com a ligação SCSI, no entanto, esta topologia, que utiliza Fibre Channel, apresenta uma performance muito melhor e atinge distâncias maiores. VI. Exemplo de Ligação Ponto-a-ponto 17 Loops ou anéis: Fibre Channel Arbitrated Loop (FC-AL): Nesta topologia utiliza-se hub, cuja largura de banda de no máximo de 100 MB/s é compartilhada por todos os seus membros. Teoricamente suporta loops com até 126 dispositivos, mas na prática este número é bem menor. Esta topologia está sendo muito pouco utilizada nas SANs modernas. Algumas pessoas comparam esta topologia como uma rede Token Ring, em que a largura de banda é dividida por todos os dispositivos do loop. Entretanto há equipamentos antigos que não suportam o modo fabric e, assim, é utilizado o modo em loop. VII. Exemplo de TopologiaFC-AL Malha (Switched fabric ou apenas fabric): Nesta topologia, utiliza-se switches Fibre Channel, o que permite um grande número de dispositivos interconectados. Dedica largura de banda integral a cada uma das portas e permite transferências de dados simultaneamente para um único nó. É a topologia que permite mais escalabilidade e crescimento. Teoricamente, pode conter mais de 7,7 milhões de nós. 18 VIII. Exemplo de Topologia Fabric Topologia mista: Na literatura, encontramos, ainda, a possibilidade de combinar as duas topologias, o que não é comum de se fazer: IX. Exemplo de Topologia Mista 19 4. SAN X NAS Vistas como concorrentes, as SANs – Storage Area Network e as NAS – Network Attached Storage são tecnologias complementares: Enquanto as primeiras são otimizadas para transferências de altos volumes de dados orientadas em bloco, as NAS oferecem acesso a dados em nível de arquivo. Baseadas em protocolos abertos, como Fibre Channel e TCP/IP, oferecem varias vantagens em relação ao sistema de armazenamento ligado ao servidor. As SANs – Storage Area Networks e NAS – Network Attached Storage estão cada vez mais substituindo ou complementando as tradicionais aplicações dedicadas a servidores em muitos data centers. Como resultado, as corporações estão obtendo muitos benefícios, inclusive aumento de flexibilidade, instalação facilitada de sistemas de armazenamento e redução geral de custos de armazenamento. Embora ambas as tecnologias possam oferecer vantagens competitivas, cada uma é designada para tipos específicos de ambientes e aplicações. [4] Tab. I – Características das SANs e NAS SAN Protocolo • Fibre Channel • Fibre Channel para SCSI Aplicações • Processamento de aplicações de banco de dados de missão critica. • Backup de dados centralizado • Operações de recuperação de desastres • Consolidação de armazenamento Vantagens • • • • • • • • Alta disponibilidade Confiabilidade na transferência de dados Trafego reduzido na rede primaria Flexibilidade de configuração Alto desempenho Alta escalabilidade Gerenciamento centralizado Oferta de múltiplos fornecedores X. NAS • TCP/IP • Compartilhameto de arquivo em NFS e CIFS Transferência de pequenos blocos de dados a longas distancias Acesso ao banco de dados limitado somente a leitura • • • • • Poucas limitações de distancia Adição simplificada da capacidade de compartilhamento de arquivo Fácil instalação e menutenção Tabela Comparativa entre as Tecnologias 20 5. CONFIGURAÇÃO DO SISTEMA DE ARMAZENAMENTO Block Diagram Storage Processor Storage Processor CMI Fibre Channel or Gigabit Ethernet Fibre Channel or Gigabit Ethernet Power supply Mirrored cache Fan CPU FC SPS Fan Mirrored cache Fan Power supply CPU SPS LCC FC LCC XI. LCC LCC LCC LCC Exemplo de Topologia Interna do Storage Para maior confiabilidade, a arquitetura dos Storages mais modernos incluem dois processadores ativos de armazenamento, cada um capaz de acessar de forma independente todos os drives no array. Esse projeto garante as operações contínuas, por meio do failover automatizado no caso de um processador de armazenamento tornar-se indisponível. Além disso, o ambiente operacional de armazenamento proporciona à arquitetura flexibilidade necessária para dar suporte a várias gerações de hardware e a diversos tipos de interconexões com funcionalidade consistente, garantindo assim a proteção do investimento.[5] O ambiente operacional de armazenamento fornece também a funcionalidade avançada necessária para melhorar a relação custo/benefício e aumentar a disponibilidade de aplicativos, por meio de diversos recursos como: 21 Grupos de LUNs que, por meio de striping ou concatenação, dão ao usuário flexibilidade e controle do layout de dados no array. Os metaLUNs melhoram o desempenho, permitindo que um volume englobe um grande número de drives, além de possibilitar o uso mais eficiente da capacidade, expandindo-a sem interrupções em qualquer local do array. Movimentação dinâmica de dados entre drives FC e ATA, além de fornecer recursos do tipo ILM( Information Lificycle Management) dentro de um único array Os dados também podem ser movidos de um volume de um tipo de RAID para outro de um tipo diferente, atendendo aos requisitos de desempenho de um aplicativo específico. Alem de alta disponibilidade em todos os dispositivos de hardware como: Cache de gravação, sendo que cada processador de armazenamento contém os principais dados em cache dos seus LUNs, bem como uma cópia secundária do cache do processador de armazenamento de mesmo nível. Bateria de reserva para controladores e discos com compartimentos de cache, o que permite um desligamento ordenado, de forma a garantir a proteção em caso de uma falha de energia. Proteção de RAID nos níveis 1/0, 0, 1, 3 e 5, todos podendo existir simultaneamente no mesmo array para atender aos diferentes requisitos de proteção dos dados. 22 6. CONCLUSÃO A SAN é hoje uma alternativa para suprir as necessidades de armazenamento de dados, que por sua vez deve ser analisada de forma real, pois ainda se trata de uma solução cara para as empresas. As empresas devem entender bem o conceito dessa nova rede de armazenamento e procurar não usar apenas o hardware dessa solução, mas todo o conjunto que se baseia no software e serviços de implementação dessa solução. Os acessos aos recursos da rede são dinâmicos, uma vez que todos os recursos estão disponíveis para a rede como um todo e não ligados fisicamente a um servidor, beneficiando a criação de sistemas de redundâncias . Com a centralização das informações, facilitando a administração, bem como cuidar da segurança, além de se ter uma rede com escalabilidade, flexibilidade, disponibilidade e menos tempo de 10downtime . Não podemos confundir problemas de espaço com problemas de não se ter regras com o que se armazena nos servidores hoje em dia, pois não adianta ter um sistema eficaz e eficiente disponível e continuar sem regras sobre o que se deve armazenar. Tudo que as pessoas precisam fazer na rede é alimentado por dados, voltado para dados e dependente de dados. Enquanto a utilização da rede aumenta, você precisa ter certeza de que terá a capacidade de armazenagem de dados confiável e de alto desempenho de que vai precisar - no momento em que precisar dela. A STORAGE AREA NETWORK, surgiu como uma alternativa simples e eficiente para ser usada nesse momento e deve ser o padrão de tipo de armazenamento dos próximos anos. 10 Tempo de parada de aplicações e servidores críticos. 23 Referência Bibliográfica [1] EMC Brasil Inc .URL: http://www.emc2.com.br. Recuperado em 10/10/2005, 15:00. [2] Storage Networking Industry Association. URL: http://www.snia.org/. Recuperado em 20/04/2005, 21:00. [3] URL: http://www.fibrechannel.org/. Recuperado em 10/04/2005, 15:40 [4] URL: http://www.nas-san.com. Recuperado em 01/09/2005, 20:35. [5] NEMETH, Evi.; SNYDER, Garth.; SEEBASS, Scott.; HEIN, Trent R. Manual de Administração do Sistema UNIX, 3a edição 24 Bibliografia Consultada http://www.dothill.com/tutorial/index.htm. Recuperado em 01/04/2005, 13:52 http://eval.veritas.com/webfiles/docs/san-whitepaper.pdf. Recuperado em 03/04/2005, 22:10. http://www.qlogic.com/documents/datasheets/knowledge_data/whitepapers/whitepapers.zonin g.pdf. Recuperado em 10/04/2005, 15:30. http://www.networkcomputing.com/1109/1109ws1.html. Recuperado em 10/04/2005, 15:30. http://www.networkmagazine.com/shared/article/showArticle.jhtml?articleId=17601008&pgn o=2. Recuperado em 20/04/2005, 21:00. http://www.sun.com/storage/white-papers/fc_comp.html. Recuperado em 01/09/2005, 20:35. http://www.ibm.com. Recuperado em 10/10/2005, 16:00. http://www.hitachi.com. Recuperado em 20/09/2005, 22:00 http://www.hp.com. Recuperado em 20/09/2005,22:00. .