Software IBM Outubro de 2011 Thought Leadership White Paper Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura Por Richard Vining, Product Marketing Manager, Tivoli Storage Software 2 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura Índice 2 Resumo executivo 2 As pressões crescentes sobre os administradores de armazenamento 3 Sobrevivendo ao crescimento dos dados: Opções para uma redução efetiva de dados 3 Evitando a duplicação de dados 5 Categorizando dados e automatizando a migração e a exclusão 9 Deduplicando e comprimindo o que sobrou 11 Economizando dinheiro com a desduplicação do Tivoli Storage Manager 12 Escolhendo entre ProtecTIER e Tivoli Storage Manager 13 Por que a IBM? 14 Próximos passos 16 Para mais informações Resumo executivo As organizações estão armazenando e utilizando mais dados do que nunca. O volume de dados está crescendo exponencialmente, as regulamentações governamentais e as pressões da concorrência aumentam – o que força as organizações a reterem mais dados por períodos mais longos. No entanto, os orçamentos para gerenciamento de armazenamento permanecem os mesmos ou estão diminuindo. A "diferença de gerenciamento de armazenamento" resultante é composta também por maiores requisitos de disponibilidade de dados e mitigação de riscos. Por exemplo: alguns aplicativos críticos não conseguem suportar qualquer tempo de parada , nem mesmo para backup, e são incapazes de tolerar qualquer perda de dados. Se seus sistemas de dados ficarem indisponíveis, é possível perder oportunidades de renda; no mundo atual “on demand”, os clientes simplesmente irão a outro lugar caso você não consiga ajudá-los imediatamente. Interrupções de negócios podem fazer com que clientes e parceiros percam a confiança em você. Indisponibilidades e violações graves são divulgadas na mídia com frequência, causando constrangimento no mercado. A incapacidade de fornecer produtos ou serviços pode resultar em penalidades contratuais, enquanto a incapacidade de fornecer relatórios aos órgãos do governo pode resultar em multas. Em casos extremos, como na Lei Sarbanes-Oxley, seu CEO ou CFO poderia até ser preso. Resumindo, as organizações precisam proteger melhor os ativos de dados e, à medida que tais ativos crescem e os orçamentos diminuem, é necessário fazer mais com menos. São necessárias soluções mais inteligentes. Este artigo aborda o desafio de sobreviver e até mesmo prosperar neste ambiente; além disso, descreve várias opções da IBM disponíveis para lidar com os desafios do crescimento de dados mediante a redução efetiva da quantia de dados que precisam ser gerenciados. Os administradores de armazenamento continuam enfrentando uma taxa enorme de crescimento de dados, mas não recebem os recursos necessários para gerenciar tudo isso. As pressões crescentes sobre os administradores de armazenamento Os administradores de armazenamento estão na linha de frente dessa batalha. Conforme os dados crescem, são desafiados a concluir operações de backup dentro das janelas de backup estabelecidas – mesmo com os requisitos de negócios diminuindo os tempos concedidos. Consequentemente, alguns dados talvez não passem por backup, ficando perigosamente desprotegidos. Mais dados no sistema de backup significa mais tempo para se recuperar quando algo dá errado. Isso se soma ao tempo de indisponibilidade, o que aumenta o risco de perder oportunidades de receita. E, evidentemente, se não for feito um backup apropriado dos dados, estes não podem ser recuperados – precisarão ser recriados ou serão perdidos para sempre. Software IBM 3 Uma das soluções para todo este crescimento de dados consiste em simplesmente comprar mais armazenamento. O custo do armazenamento propriamente dito tem caído com o passar do tempo; portanto, não é tão doloroso. Entretanto, os custos com acomodação, energia, refrigeração e gereciamento de todos esses dispositivos não param de crescer, especialmente conforme novos tipos e modelos de sistemas de armazenamento são incluídos. Além disso, naturalmente, seu negócio está sempre mudando. Os administradores de armazenamento precisam se adaptar às muitas mudanças em seus ambientes, que vão desde colocar novos aplicativos e origens de dados online a assimilar dados e sistemas de fusões e aquisições, assim como manter-se em conformidade com novos mandatos corporativos e governamentais de gerenciamento de dados. A IBM pode ajudá-lo a construir uma infraestrutura de gerenciamento de armazenamento mais inteligente que permitirá lidar com todos esses desafios. Temos soluções para ajudá-lo a reduzir sua área de cobertura de armazenamento de dados, além de auxiliá-lo a: Reduzir seus custos de capital e operacionais mediante a menores requisitos de armazenamento. Melhorar a disponibilidade de seus aplicativos e seus níveis de serviço com a redução do tempo de inatividade. Mitigar os riscos competitivos associados à perda de dados em um ambiente que muda rapidamente. A IBM tem uma abordagem holística para redução de dados, fornecendo soluções para backups eficientes, armazenamento em camadas e desduplicação de dados. Sobrevivendo ao crescimento dos dados: Opções para uma redução efetiva de dados A IBM tem uma abordagem holística à redução de dados, ao contrário dos concorrentes, que oferecem soluções pontuais para problemas que, na verdade, eles mesmos podem estar causando. Um dos fatores que mais contribui para o crescimento de dados é, por exemplo, a duplicação repetida de grandes quantidades de dados sempre que se realiza um backup “full”. Na abordagem holística da IBM, uma opção é evitar o crescimento dos dados a partir da duplicação desnecessária de dados; para tanto, é feito backup somente dos dados que mudaram desde o backup anterior. Outra opção é determinar quais tipos diferentes de dados há e categorizá-los para que seja possível gerenciá-los de modo mais efetivo, movendo os dados acessados com menos frequência para camadas de armazenamento mais baratas, além de mover automaticamente os dados mais antigos para a camada certa de armazenamento e excluir os que se tornaram desnecessários ou indesejados. Isso abreviará os ciclos de backup e melhorará o desempenho dos aplicativos. Finalmente, podemos comprimir e deduplicar os dados que são colocados em seus sistemas de proteção e retenção de dados. O portfólio do IBM® Tivoli® Storage Manager permite backups somente incrementais que evitam a desduplicação desnecessária dos dados. Evitando a duplicação de dados A ideia é tratar a causa do problema, não os sintomas. Se sua taxa semanal de modificação de dados é de 10%, isso significa que 90% dos seus dados não mudaram esta semana. Se fizer um backup “full” de tais dados neste fim de semana, você duplicará quase tudo aquilo de que fez backup no fim de semana passado. Além de ocupar muita capacidade de armazenamento, isso também toma bastante tempo – e esses problemas só pioram à medida que mais dados são criados. Não é surpresa que os produtos de desduplicação de dados tenham se tornado tão populares, pois foram criados para eliminar todos os dados duplicados a partir de backups “full”s repetidos. Quando afirmam que podem reduzir sua área de cobertura de armazenamento de backup em 90% ou mais, é exatamente a esses dados que se referem. Mas se não fosse preciso fazer outro backup “full” após o inicial? Se você fizesse backup apenas dos dados novos e modificados – sempre –, não criaria todos os dados duplicados que precisam de uma solução de desduplicação cara para serem desfeitos. Os benefícios de eliminar o backup “full” semanal incluiriam janelas de backup mais curtas, menor necessidade de armazenamento e redução dos custos de aquisição de armazenamento. 4 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura A IBM tem soluções mais inteligentes que podem ajudar a prevenir a necessidade de realizar backups “full”s. Os produtos do portfólio do IBM Tivoli Storage Manager para gerenciamento de recuperação unificado fornecem backups somente incrementais. “full” + diferencial Backup – Exige um backup “full” e, em seguida, backups diferenciais com o passar do tempo – geralmente, um backup “full” a cada fim de semana, com backups diferenciais nos seis dias seguintes. Isso significa que todos os dados que foram modificados desde o último backup “full” passarão por um novo backup. Supondo uma taxa de modificação diária de 10%, será feito um backup de 100% (“full”) no primeiro dia, 10% no segundo, 20% no terceiro, 30% no quarto, 40% no quinto, 50% no sexto e 60% no sétimo. Isso significa fazer backup de 260% de seus dados a cada semana! Você precisará de uma capacidade de produção 10 vezes maior para apenas um mês de backups. Restauração – O último backup “full” seria restaurado e, em seguida, o último backup diferencial, até a data da restauração. Este modelo é mais rápido e confiável que o “full” + incremental, mas com o custo de uma capacidade de armazenamento muito maior. O IBM Tivoli Storage Manager faz backup dos arquivos que foram modificados desde o backup anterior; no caso de arquivos maiores, como enormes bancos de dados, pode realizar backups de subarquivos, copiando somente as seções do arquivo que foram modificadas. O IBM Tivoli Storage Manager FastBack® vai ao próximo nível, fazendo backup apenas dos blocos individuais de dados que foram modificados à medida que são gravados no disco. E pelo fato de fazer backups sem impactar os aplicativos, pode fazê-los com mais frequência, o que significa menos dados com risco de serem perdidos. O IBM Tivoli Storage Manager FastBack for Workstations protege continuamente os dados em computadores de área de trabalho e laptops, copiando, mais uma vez, somente os arquivos novos ou que foram modificados. Incremental progressivo O IBM Tivoli Storage FlashCopy® Manager aproveita tecnologias de captura instantânea incrementais com base em hardwares e Backup – Exige um backup “full” na primeira vez em que o backup softwares para proporcionar proteção de dados e recuperação de é feito e, em seguida, somente backups incrementais. Não ocorrem aplicativos rápidas e eficientes. transferências extras de dados, o que economiza largura de banda de rede Metodologias de Backup e tempo de transferência, acelera o backup e a restauração e pode “full” + incremental economizar muitos milhares de dinheiro em custos de disco e fita. Restauração – É preciso escolher o ponto a partir do qual deseja Backup – Exige um backup “full” e, em seguida, backups incrementais com o restaurar e, em seguida, restaurar os arquivos necessários somente passar do tempo – geralmente, um backup “full” a cada fim de semana, com uma vez. É um método muito mais rápido e confiável que os backups incrementais nos seis dias seguintes. Somente os dados que foram outros dois. modificados a partir do dia anterior são transferidos para a fita. Então, no final da semana, outro backup “full” precisa ser executado. A metodologia exclusiva de backup incremental Restauração – O último backup “full” deve ser restaurado e, em seguida, os dados incrementais de cada dia são aplicados a ele. Isso progressivo do Tivoli Storage Manager pode significa que, se tiver um backup “full” e três backups incrementais economizar terabytes de capacidade de backup por mês. do mesmo arquivo, este será restaurado quatro vezes. É um desperdício de tempo e dinheiro; além disso, gera riscos. Software IBM 5 Backup incremental progressivo com Tivoli Storage Manager Um banco de dados relacional IBM DB2® interno permite que o Tivoli Storage Manager realize backups incrementais progressivos, porque rastreia cada arquivo individual e sabe exatamente como seus sistemas estão a cada dia. Quando há necessidade de restauração, somente a versão do arquivo necessário é restaurada. Ao contrário de outras soluções de backup com base em arquivo que requerem a execução de backups “full”s periódicos (normalmente semanalmente) para assegurar tempos de recuperação razoáveis, a metodologia exclusiva de backup incremental progressivo nunca requer a execução de outro backup “full” depois que o primeiro é feito para configurar a base. O resultado, conforme mostrado na Figura 1, pode ser uma economia de muitos terabytes de capacidade de backup todos os meses. 2500 Gigabytes 2000 1500 1000 500 Seg Ter Qua Qui Semana 1 Fornecedor A: “full” + Diferencial Sex Fim de Seg Semana Fornecedor B: “full” + Incremental Ter Qua Qui Sex Semana 2 Fim de Semana Tivoli Storage Manager: Incremental progressivo Figura 1: A metodologia de backup incremental progressivo do Tivoli Storage Manager pode poupar muitos terabytes de capacidade de backup. Capacidade de Backup Necessária para Um Mês: Fornecedor A 26 TB Fornecedor B 14 TB Tivoli Storage Manager 7 TB O banco de dados interno do Tivoli Storage Manager também proporciona outras economias de custo, por meio de escalabilidade, desempenho e confiabilidade excelentes. Atualmente, o banco de dados é suportado para gerenciar quatro bilhões de objetos de dados (arquivos e blocos de arquivos deduplicados) em um único Tivoli Storage Manager Server. Não há necessidade de servidores de mídia caros e complexos adicionais, conforme exigido por produtos da concorrência para atender às necessidades até mesmo dos maiores datacenters. A movimentação de dados para camadas mais baratas de armazenamento e a exclusão de dados desnecessários do ambiente podem reduzir a necessidade de capacidade de armazenamento primário e podem facilitar o gerenciamento e proteção de dados. Comparação dos Requisitos de Capacidade 0 A análise mostrada na Figura 1 começa com 2 TB de dados e adiciona ou modifica 200 GB por dia. Assume-se que um backup “full” já foi realizado para definir a base. Categorizando dados e automatizando a migração e a exclusão Outra opção para reduzir a área de cobertura do armazenamento de dados é avaliar os diferentes tipos de dados e onde eles estão no seu ciclo de vida. Se sua organização é como a maioria das demais, todos os seus dados não estruturados estão em sistemas de arquivos simples, que provavelmente estão cheios de dados que você raramente – ou nunca – precisa acessar. Isso pode incluir dados que você não é mais obrigado a manter, seja por lei ou política, mas que não excluiu – como arquivos de projetos e funcionários antigos –, que poderiam custar caro se descobertos em procedimentos legais. O objetivo é identificar quais dados podem ser movidos para camadas de armazenamento mais baratas e quais podem ser excluídos inteiramente do ambiente e, em seguida, automatizar o processo. Isso reduzirá 6 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura a necessidade de comprar mais capacidade de armazenamento primário e facilitará o gerenciamento e a proteção daquilo que você tem. O desempenho do backup e da restauração melhorará; além disso, ficará mais fácil comprovar que as políticas de retenção e expiração de dados estão sendo cumpridas. A IBM oferece o IBM Tivoli Storage Productivity Center for Data para tal finalidade (vide Figura 2). Essa solução relata onde estão seus dados, separados por datas de acesso ou em que foram salvos, a quem pertencem, o aplicativo que os criou e diversos outros filtros. Com a inteligência adquirida a partir de tais relatórios, é possível configurar políticas significativas em seu software de gerenciamento de dados para tomar automaticamente a ação apropriada em relação a dados que não deveriam estar ocupando seus sistemas primários. O Tivoli Storage Productivity Center for Data também pode ajudar a identificar e eliminar dados duplicados, dados órfãos, dados temporários e dados que não são de negócios. Exemplo de Relatório de Resumo de Dados do Tivoli Storage Productivity Center for Data Figura 2: O Tivoli Storage Productivity Center for Data pode ajudá-lo a entender melhor seus dados, permitindo categorizá-los e gerenciá-los de maneira mais efetiva. Software IBM 7 As soluções do Tivoli Storage Manager movem automaticamente dados para outras mídias com base nas políticas configuradas, liberando um espaço valioso em disco para arquivos ativos. A família Tivoli Storage Manager inclui duas soluções para automatizar a migração de dados entre diversas camadas de armazenamento: IBM Tivoli Storage Manager for Space Management, que é para servidores IBM AIX®, HP-UX, Sun Solaris e Linux, e o IBM Tivoli Storage Manager HSM for Windows, que é para servidores Microsoft Windows. Essas soluções trabalham de forma transparente no plano de fundo, automaticamente selecionando e movendo arquivos de camadas de armazenamento primário para secundário com base nos critérios de política definidos, como tamanho do arquivo ou tempo transcorrido desde que um arquivo foi aberto. Deixam um ponteiro, ou arquivo stub, onde os dados foram armazenados originalmente para que os usuários e aplicativos não precisem se preocupar com o local onde os dados foram armazenados; a solução roteia novamente, com transparência, a solicitação de quaisquer arquivos movidos. Não aparecerão mais mensagens de falta de espaço em disco. As soluções do Tivoli Storage Manager movem dados automaticamente para a mídia adequada com base nas políticas definidas, liberando espaço valioso em disco para arquivos ativos e proporcionar acesso automatizado aos arquivos migrados quando necessário. Migrações são programadas para minimizarem o tráfego de rede durante horários de pico. Migrações automáticas que ocorrem fora da janela de backup. As soluções de migração de dados do Tivoli Storage Manager não somente ajudam a limpar os sistemas de armazenamento primário, como também podem ser usadas para mover dados mais facilmente para novas tecnologias de armazenamento, conforme são implementadas (veja a Figura 3). A migração de arquivos para o Tivoli Storage Manager ajuda a acelerar as restaurações, já que não há necessidade de restaurar arquivos migrados em caso de desastre. Tivoli Storage Manager Hierarchy of Storage Disk pools Virtual tape Tape pools App Servers Prod. Data Tivoli Storage Manager Server Figura 3: As soluções de gerenciamento de espaço do Tivoli Storage Manager podem ajudar a reduzir os custos de armazenamento e administração. O uso do Tivoli Storage Manager para permitir a utilização mais As soluções de migração de dados do Tivoli Storage Manager ajudam os clientes eficiente do armazenamento pode ajudá-lo a: a controlarem, e gerenciarem com eficiência, o crescimento de dados e os custos de armazenamento associados mediante o fornecimento de gerenciamento Melhorar os tempos de resposta dos servidores de arquivos mediante automatizado do espaço. Essas soluções oferecem os seguintes recursos importantes: a transferência de dados inativos. Mover arquivos de baixa atividade ou inativos para uma hierarquia A "virtualização" do “storage pool” ajuda a maximizar o uso dos de armazenamento de menor custo. recursos de armazenamento do Tivoli Storage Manager. Explorar mais profundamente os ativos de armazenamento existentes. O gerenciamento da restauração é otimizado com base na Reduzir os tempos de backup e a utilização de recursos ao concentrar localização dos dados na hierarquia. somente em arquivos ativos. A migração é transparente para os usuários e aplicativos. Eliminar atividades de limpeza manual de sistemas de arquivos. 8 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura Arquivamento de informações O arquivamento é outra técnica importante de redução de dados para certos tipos de dados. Exemplos incluem dados históricos de relatórios financeiros e registros médicos que precisam ser retidos para referência futura, mas não precisam consumir espaço valioso em disco onde deveria haver dados ativos. Registros médicos e históricos de declarações de clientes também se encaixam com frequência nessa categoria. O arquivamento é para a retenção de registros em longo prazo. Ele difere do backup porque mantém os arquivos por um período específico (enquanto o backup mantém determinado número de versões de um arquivo) ao mesmo tempo que remove os dados de sistemas de armazenamento de produção primários completamente. Os principais recursos das soluções de arquivamento da IBM incluem: Armazenamento de longo prazo em mídias com custo reduzido. Cópias pontuais que fornecem histórico de revisão e permitem auditoria. Desduplicação de dados para remover cópias redundantes de dados. Impingir políticas de período de retenção e "espera de retenção". Processamento rápido da expiração. A IBM oferece opções de soluções para arquivamento, dependendo das preferências do cliente e requisitos para retenção de registros em longo prazo. A IBM oferece opções de soluções para arquivamento, dependendo das preferências do cliente e dos aplicativos envolvidos (vide Figura 4). O Tivoli Storage Manager inclui um recurso de arquivamento integrado diretamente no software de backup do cliente. É baseado em políticas, o que permite que o administrador configure os tempos de retenção. Se o requisito de tempo de retenção de um arquivo mudar, o administrador precisa apenas atualizar a política, enquanto o software atualizará retroativamente os arquivos já arquivados; não é necessário restaurar e rearquivar, como exigem algumas ofertas da concorrência. O Tivoli Storage Manager também oferece a opção de integrar dados de muitos aplicativos diferentes em seu repositório de arquivos; o repositório de arquivos pode ser um conjunto virtualizado de sistemas de armazenamento heterogêneos. Soluções de Arquivamento da IBM Arc hiv e e hiv App Servers App Servers ve Acelerar o tempo de recuperação do servidor de arquivos mediante a movimentação de arquivos arquivados e cópias de arquivos para uma hierarquia de armazenamento de menor custo. Reduzir os tempos de backup e a utilização de recursos ao concentrar somente em arquivos ativos. Localizar informações históricas facilmente usando arquivos arquivados que são indexados com metadados descritivos. Ar c O uso de soluções de arquivamento da IBM para a retenção de registros pode ajudá-lo a: Re tri e Re tri e ve Disk pools Virtual tape Tivoli Storage Manager Server Tape pools IBM Information Archive Figura 4: As soluções de arquivamento da IBM incluem Tivoli Storage Manager e IBM Information Archive. Software IBM 9 O IBM Information Archive, que contém uma versão especializada do Tivoli Storage Manager denominada IBM System Storage® Archive Manager, é um aplicativo de arquivamento independente que ingere dados diretamente a partir de mais de 40 aplicativos, incluindo sistema de mensagens, imagens médicas e de saúde, design e engenharia, gerenciamento de documentos e outros. Pode impingir políticas de retenção flexíveis por meio de sua arquitetura de "coleções" exclusiva e proporciona segurança e integridade de dados no longo prazo. O IBM Optim™ Data Growth Solution é uma solução exclusiva de arquivamento de banco de dados que migra com transparência registros desnecessários de tabelas de bancos de dados para armazenamento secundário. Arquivamento de banco de dados com IBM Optim e Tivoli Storage Manager O IBM Optim Data Growth Solution é uma solução exclusiva de arquivamento de banco de dados que migra com transparência registros desnecessários de tabelas de bancos de dados para armazenamento secundário. Como as soluções de gerenciamento de espaço e arquivamento do Tivoli Storage Manager, o Optim oferece aos administradores de bancos de dados e armazenamento uma série de benefícios de custo e desempenho. Também há benefícios relacionados ao uso do Tivoli Storage Manager em conjunto com o Optim, que trabalha de maneira continua com a interface de programas aplicativos (API) do Tivoli Storage Manager a fim de mover registros de bancos de dados arquivados diretamente para a hierarquia de armazenamento do Tivoli Storage Manager, criando uma solução de arquivamento e restauração em só uma etapa. Com qualquer outro produto de backup/restauração baseado em arquivo, o Optim utiliza operações de arquivo padrão para armazenar/arquivar dados em um sistema de arquivos baseado em disco e, em seguida, o produto de backup pode fazer backup do arquivo para a mídia de backup suportada. O uso do Optim e do Tivoli Storage Manager em conjunto permite: Arquivar dados diretamente em disco e fita ou fazer com que o Optim use o Tivoli Storage Manager para migrá-los automaticamente para fita. Fazer backup de dados arquivados do Optim incrementalmente para um storage pool do Tivoli Storage Manager que poder ser gerenciado pelo Tivoli Storage Manager para disponibilidade local, recuperação de desastre ou área segura remota. A desduplicação de dados foi criada para reduzir os requisitos de capacidade de armazenamento de dados mediante a eliminação de dados duplicados a partir de diversos sistemas de origem. Deduplicando e comprimindo o que sobrou Se estiver utilizando uma solução de backup que requer backups “full”s periódicos, a desduplicação de dados certamente ajudará a diminuir a quantia de dados gerenciados. Do contrário, a taxa de redução que é possível esperar a partir da desduplicação dependerá de seu ambiente de backup específico. A desduplicação de dados foi criada para reduzir os requisitos de capacidade de armazenamento de dados. Alguns dos dados duplicados existem em diversos sistemas de origem, mas a maioria da duplicação é causada pelo armazenamento de conjuntos de backups “full” repetitivos. 10 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura A ideia básica por trás da desduplicação de dados é armazenar somente uma cópia de qualquer objeto de dados e colocar ponteiros para a cópia única sempre que as duplicatas forem eliminadas (vide Figura 5). Algumas soluções fazem isso em nível de arquivo, de forma que os arquivos precisam ser exatamente os mesmos a serem deduplicados. Com frequência, tal processo é chamado de armazenamento de instância única (SIS). Outras soluções deduplicam dados com extensão de bloco fixa ou variável. As soluções da IBM utilizam uma abordagem mista baseada no tamanho dos dados – baseada em arquivo para arquivos menores e de bloco variável para arquivos maiores. A maioria das soluções de desduplicação executa uma combinação de algoritmos de soma de verificação em relação aos dados selecionados para criar uma assinatura hash e, a seguir, verificar se tal assinatura já foi vista antes. Em caso afirmativo, os dados são descartados e, em seu lugar, coloca-se um ponteiro para os dados já armazenados. Um pequeno número de soluções sofisticadas, incluindo os sistemas System Storage ProtecTIER® da IBM, realiza uma comparação diferencial completa dos dados em nível de byte para remover todo o potencial de "colisões de dados", nas instâncias extremamente raras em que dois blocos distintos possam compartilhar a mesma assinatura hash. Desduplicação de Dados Data Store Data Store Data Store 1. Data chunks are evaluated to determine a unique signature for each 2. Signature values are compared to identify all duplicates 3. Duplicate data chunks are replaced with pointers to a single stored chunk, saving storage space Figura 5: A desduplicação de dados reduz a quantia de dados que precisam ser gerenciados mediante a criação de apenas uma cópia de qualquer objeto de dados e a substituição de duplicatas com ponteiros para tal cópia única. A desduplicação de dados pode ocorrer – e realmente ocorre – em muitos pontos ao longo do ciclo de vida de criação e gerenciamento dos dados. Em geral, esses pontos de desduplicação podem ser divididos em lado de origem, onde os dados são criados, e lado de destino, onde são armazenados e gerenciados. Os aplicativos de backup podem, por exemplo, realizar desduplicação no lado de origem ao não transferir dados cujo backup foi feito anteriormente na LAN ou WAN, economizando largura de banda. No lado de destino, o uso mais popular da desduplicação acontece em bibliotecas de fita virtual ou VTLs. Esses sistemas baseados em disco emulam bibliotecas de fita e unidades, mas aplicam a desduplicação para armazenar quantias equivalentes de dados em disco com custo bastante reduzido, enquanto oferecem vantagens de desempenho em relação à fita. Fazer a desduplicação em sistemas baseados em fita é considerado uma má ideia exceto quando o conjunto de dados inteiro pode ser armazenado em um único cartucho de fita; seria muito difícil garantir a manutenção dos dados originais para todos os ponteiros em diversas fitas. Atualmente, a IBM oferece duas soluções de desduplicação de dados atraentes. O Tivoli Storage Manager inclui recursos de desduplicação de dados de origem e de destino. No lado de origem, o agente de backup decide se enviou um bloco de dados ao servidor de backup no passado; em caso afirmativo, não o envia novamente. A seguir, também pode interrogar o servidor de backup para determinar se outro cliente fez backup do mesmo bloco. O resultado líquido é uma redução dos dados enviados pela rede, acelerando o processamento do backup. Ambientes de servidores virtualizados, como o VMware vSphere, normalmente contêm uma grande quantia de dados duplicados, considerando o aspecto comum da maioria das imagens de máquina virtual. Ao utilizar Software IBM 11 o Tivoli Storage Manager for Virtual Environments ou o Tivoli Storage Manager FastBack para proteger essas máquinas virtuais, a desduplicação integrada de dados consegue diminuir consideravelmente a quantia de dados que passam por backup e são transferidos pela rede, especialmente no caso de backups de imagem “full”s. Em seguida, o Tivoli Storage Manager realiza a desduplicação de dados no lado de destino como um processo posterior no Tivoli Storage Manager Server. Isso foi comprovado em testes de laboratório com o objetivo de reduzir em até 40% a quantia de dados em conjuntos de armazenamento em disco. Após a execução, ele recupera automaticamente o armazenamento que foi liberado. Além de reduzir os requisitos de armazenamento, também é possível armazenar mais versões de backup em disco para acelerar as operações de recuperação, ao invés de recuperar a partir da fita. A outra solução de desduplicação de dados é a família IBM System Storage ProtecTIER de sistemas de fita virtual para a redução de dados com diversas origens, incluindo servidores Tivoli Storage Manager, backups de outros sistemas de backup ou soluções de software de arquivamento. O ProtecTIER realiza uma desduplicação em linha extremamente rápida e pode ser comprado como um subsistema “full” ou como um gateway para seus dispositivos de armazenamento existentes. Os recursos de desduplicação do Tivoli Storage Manager ajudam a reduzir os tempos de recuperação ao possibilitar o armazenamento de mais dados de backup em disco ao invés de fita. Economizando dinheiro com a desduplicação do Tivoli Storage Manager Os recursos de desduplicação de origem e destino do Tivoli Storage Manager funcionam com dados de origens que incluem backups normais, dados importados pelo Tivoli Storage Manager API e dados de arquivos e de HSM e são incluídos sem custos adicionais. O Tivoli Storage Manager deduplica conjuntos de dados baseados em disco como um processo posterior, de maneira que não haja impacto no desempenho de backup. Quando utilizada como parte do Tivoli Storage Manager Suite for Unified Recovery, um conjunto de dez produtos do Tivoli Storage Manager que é precificado de acordo com a quantia de dados gerenciados, a desduplicação pode reduzir consideravelmente os custos totais da solução de backup. “Tape reclamation” é outra forma do Tivoli Storage Manager aumentar o ROI, por meio da utilização inteligente de fitas. Com o tempo, os arquivos contidos na fita irão expirar, deixando pedaços de espaço “inúteis” que não podem ser reutilizados. Ao invés de ter de esperar até que todos os dados da fita expirem, é possível configurar uma política no Tivoli Storage Manager para mover, com base na porcentagem de espaço inútil, os dados de qualidade remanescentes para outra fita – consolidando, assim, os dados de qualidade e liberando as outras fitas para serem reutilizadas. O Tivoli Storage Manager também se distingue dos demais porque realiza o “reclamation” automaticamente para os volumes que serão levados para fora da empresa. Para tanto, cria um novo conjunto de fitas para serem levadas para fora e, em seguida, busca o antigo conjunto de fitas externas para reutilizá-las. 12 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura O uso do recurso de “reclamation” de fita do Tivoli Storage Manager permite: Reduzir os custos por meio de utilização melhor das fitas. Monitorar constantemente a utilização das fitas. Estabelecer limites de recuperação definidos pelo usuário. Planejar para que a recuperação ocorra em horários especificados ou quando o espaço livre chegar a um limite. Retornar as fitas originais para o “scratch pool”. O IBM System Storage ProtecTIER realiza comparação diferencial em nível de byte para assegurar que o dado é duplicado, garantindo a integridade dos mesmos em nível corporativo. Deduplicando com a Família IBM System Storage ProtecTIER TS7600 O IBM System Storage ProtecTIER é uma tecnologia líder em desempenho, escalabilidade, integridade de dados e confiabilidade. É a solução mais rápida no mercado para ambientes de clientes reais. Um único sistema ProtecTIER pode escalar facilmente em termos tanto de desempenho (2000 MBps) quanto de capacidade (1 PB). Além disso, o ProtecTIER inclui todos os melhores componentes da IBM, ao contrário das peças baratas de OEM encontradas em produtos da concorrência. Escolhendo entre ProtecTIER e Tivoli Storage Manager O Tivoli Storage Manager e o ProtecTIER ajudam a reduzir os requisitos de capacidade de armazenamento, os custos operacionais, o consumo de energia e o TCO; além disso, os dois permitem recuperações de dados mais rápidas. Escolher qual deles usar para a desduplicação de dados depende de vários critérios. A IBM recomenda usar os recursos de desduplicação de dados do Tivoli Storage Manager nas seguintes condições: Se houver um único servidor Tivoli Storage Manager. Para melhorar os tempos de recuperação do Tivoli Storage Manager mediante o armazenamento de mais dados de backup no disco. Caso não haja uma grande quantia de dados duplicados nos sistemas protegidos por diversos servidores Tivoli Storage Manager. Para obter operações de desduplicação completamente integradas com o Tivoli Storage Manager e assim que seja possível ter os benefícios da desduplicação sem precisar adquirir hardwares ou softwares separados. Para conseguir um gerenciamento de ciclo de vida de ponta a ponta com requisitos mínimos de armazenamento de dados. Use o ProtecTIER nas seguintes condições: Para deduplicar diversos servidores Tivoli Storage Manager (ou outro backup). Se precisar do mais alto desempenho, com até 2000 MBps ou mais. Caso precise de uma grande quantia de dados e precise de capacidade e desempenho escaláveis. É necessário desduplicação em linha para evitar o impacto operacional do processamento posterior. Você não tem o Tivoli Storage Manager e está realizando backups semanais “full”s. Também é possível utilizar o Tivoli Storage Manager e o ProtecTIER juntos para permitir a desduplicação em diversos pontos dentro de uma infraestrutura de dados complexa (vide Figura 6). Software IBM 13 Desduplicação de Dados com o Tivoli Storage Manager e o ProtecTIER Location A Location B Location C Tivoli Storage Manager Other Tape Application Servers Tivoli Storage Manager Built-in Deduplication SAN IBM ProtecTIER Figura 6: O Tivoli Storage Manager e o ProtecTIER podem ser implementados juntos para permitir a desduplicação em diversos pontos na infraestrutura de dados. O amplo portfólio de soluções de redução de dados da IBM ajuda a solucionar problemas complexos dos clientes, enquanto serviços de suporte global de alta qualidade auxiliam a proteger seus investimentos. Por que a IBM? A IBM é a única fornecedora com um conjunto abrangente de tecnologias de redução de dados. Nosso amplo portfólio de soluções de redução de dados nos dá a liberdade necessária para solucionar problemas de clientes com a tecnologia mais efetiva, enquanto nossos serviços de suporte global de alta qualidade auxiliam a assegurar que seus investimentos na redução de dados atendam às suas necessidades no longo prazo. A IBM continua investindo em pesquisa e desenvolvimento para poder criar e oferecer os recursos avançados que nossos clientes solicitam. Como mostrado na Figura 7, a IBM oferece redução de dados em um portfólio de gerenciamento de recuperação unificado que consiste em Tivoli Storage Manager, Tivoli Storage Manager FastBack e Tivoli Storage Manager FastBack for Workstations. Talvez nunca mais seja necessário realizar outro backup “full”, em qualquer lugar da sua empresa estendida. O Tivoli Storage Manager também oferece os melhores recursos de gerenciamento de fita e compressão de dados para reduzir ainda mais seus requisitos de armazenamento de backup e arquivamento. Além disso, a IBM oferece desduplicação de dados integrada ao Tivoli Storage Manager e à família de dispositivos e gateways ProtecTIER TS7600. Finalmente, por meio de soluções líderes no segmento de mercado como o IBM Information Archive, a IBM oferece soluções de arquivamento integrado para armazenar e gerenciar diversos tipos de informações de diferentes origens, ajudando as organizações a atenderem à mais ampla variedade de demandas de retenção. 14 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura Próximos passos quais tecnologias de redução de dados terão o impacto com maior redução de custo em suas operações. Também é possível solicitar uma análise abrangente de ROI usando a ferramenta Business Value Analyst (BVA) da IBM. A IBM Global Technology Services e os Parceiros de Negócios IBM estão prontos para ajudá-lo a avaliar sua situação atual e recomendar os próximos passos. Podemos ajudá-lo a determinar Escritórios de Filiais Aplicativos Datacenter Clientes FastBack Servidores de Arquivos Tivoli Storage Manager for Virtual Environments Site de D/R Clientes TSM B/A FlashCopy Manager Servidores VMware IBM System Storage IBM Information Archive Armazenamento Externo Clientes FastBack Servidor FastBack Servidor FastBack WAN Storage Manager Tivoli Storage Manager Server Camadas de Armazenamento Tivoli Storage Manager Server FastBack for Workstations Tivoli Storage Manager Administration Center Dados de Produção Dados de Backup/Arquivamento Instalação/Upgrade Monitoramento Relatórios Configuração Configurar Políticas Executar Backup/Restauração Dados de Recuperação de Desastre Figura 7: A IBM oferece redução de dados em um portfólio de gerenciamento de recuperação unificado. Storage Manager Dados Deduplicados Anotações Para mais informações A IBM está mais bem preparada para oferecer uma ampla gama de soluções de gerenciamento de armazenamento, até mesmo para ambientes de diferentes fornecedores. Podemos ajudá-lo a implementar uma infraestrutura de armazenamento dinâmico que escala para atender aos seus requisitos de negócios em transformação. Para saber mais sobre como as soluções de gerenciamento de armazenamento IBM Tivoli podem ajudá-lo a abordar suas preocupações de gerenciamento de dados em seu ambiente, entre em contato com seu representante de vendas ou Parceiro de Negócios IBM ou visite ibm.com/software/tivoli/solutions/storage. Informações adicionais estão disponíveis em ibm.com/software/tivoli/solutions/reduction. © Copyright IBM Corporation 2011 IBM Corporation Software Group Route 100 Somers, NY 10589 EUA Produzido nos Estados Unidos da América Outubro de 2011 Todos os Direitos Reservados IBM, o logotipo da IBM, ibm.com, ProtecTIER, System Storage e Tivoli são marcas registradas da International Business Machines Corporation nos Estados Unidos e/ou em outros países. Se estes ou outros termos de marca registrada da IBM estiverem acompanhados, em sua primeira referência neste documento, por um símbolo de marca registrada (® ou ™), tal símbolo indica marca registrada ou de direito consuetudinário da IBM nos EUA no momento da publicação. Tais marcas registradas também podem ser marcas registradas ou de direito consuetudinário em outros países. Uma lista atualizada das marcas registradas da IBM está disponível na web em “Copyright and trademark information”, em ibm.com/legal/copytrade.shtml Linux é uma marca registrada de Linus Torvalds nos Estados Unidos e/ou em outros países. Microsoft e Windows são marcas registradas da Microsoft Corporation nos Estados Unidos e/ou em outros países. Outros nomes de empresas, produtos e serviços podem ser marcas registradas ou de serviço de terceiros. As referências a produtos e serviços da IBM feitas nesta publicação não significam que a IBM pretenda disponibilizá-las em todos os países onde a IBM atua. Nenhuma parte deste documento deve ser reproduzida ou transmitida de qualquer forma sem a permissão por escrito da IBM Corporation. O cliente é responsável por assegurar sua própria conformidade com os requisitos legais. É de total responsabilidade do cliente obter assessoria jurídica competente a respeito da identificação e interpretação de quaisquer leis e regulamentos aplicáveis que possam afetar os negócios do cliente e quaisquer ações que o cliente possa precisar tomar para cumprir essas leis. A IBM não oferece conselho jurídico nem representa ou garante que seus produtos ou serviços irão assegurar que o cliente esteja em conformidade com qualquer lei ou regulamento. Os dados dos produtos foram revisados em relação à sua precisão na data da publicação inicial. Os dados estão sujeitos a alterações sem qualquer aviso prévio. Todas as declarações relacionadas à direção e propósitos futuros da IBM estão sujeitas a mudanças ou retirada sem aviso prévio e representam metas e objetivos apenas. As informações fornecidas neste documento são distribuídas "no estado em que se encontram", sem qualquer garantia, seja expressa ou implícita. A IBM não oferece quaisquer garantias de comerciabilidade, aptidão para um fim específico ou não infração. Os produtos IBM possuem garantia de acordo com os termos e condições dos acordos (por exemplo, IBM Customer Agreement, Declaração de Garantia Limitada, Contrato de Licença do Programa Internacional, etc.) conforme os quais são fornecidos. Recicle TIW14046-USEN-01