Software IBM
Outubro de 2011
Thought Leadership White Paper
Usando as soluções de redução de dados
da IBM para gerenciar mais dados com
menos infraestrutura
Por Richard Vining, Product Marketing Manager, Tivoli Storage Software
2
Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura
Índice
2 Resumo executivo
2 As pressões crescentes sobre os administradores de
armazenamento
3 Sobrevivendo ao crescimento dos dados: Opções para
uma redução efetiva de dados
3 Evitando a duplicação de dados
5 Categorizando dados e automatizando a migração e a exclusão
9 Deduplicando e comprimindo o que sobrou
11 Economizando dinheiro com a desduplicação do Tivoli
Storage Manager
12 Escolhendo entre ProtecTIER e Tivoli Storage Manager
13 Por que a IBM?
14 Próximos passos
16 Para mais informações
Resumo executivo
As organizações estão armazenando e utilizando mais dados do que nunca.
O volume de dados está crescendo exponencialmente, as regulamentações
governamentais e as pressões da concorrência aumentam – o que força as
organizações a reterem mais dados por períodos mais longos. No entanto, os
orçamentos para gerenciamento de armazenamento permanecem os mesmos
ou estão diminuindo.
A "diferença de gerenciamento de armazenamento" resultante é composta
também por maiores requisitos de disponibilidade de dados e mitigação de
riscos. Por exemplo: alguns aplicativos críticos não conseguem suportar
qualquer tempo de parada , nem mesmo para backup, e são incapazes de
tolerar qualquer perda de dados.
Se seus sistemas de dados ficarem indisponíveis, é possível perder oportunidades
de renda; no mundo atual “on demand”, os clientes simplesmente irão a outro
lugar caso você não consiga ajudá-los imediatamente. Interrupções de negócios
podem fazer com que clientes e parceiros percam a confiança em você.
Indisponibilidades e violações graves são divulgadas na mídia com
frequência, causando constrangimento no mercado.
A incapacidade de fornecer produtos ou serviços pode resultar em penalidades
contratuais, enquanto a incapacidade de fornecer relatórios aos órgãos do
governo pode resultar em multas. Em casos extremos, como na Lei
Sarbanes-Oxley, seu CEO ou CFO poderia até ser preso. Resumindo, as
organizações precisam proteger melhor os ativos de dados e, à medida que
tais ativos crescem e os orçamentos diminuem, é necessário fazer mais com
menos. São necessárias soluções mais inteligentes.
Este artigo aborda o desafio de sobreviver e até mesmo prosperar neste
ambiente; além disso, descreve várias opções da IBM disponíveis para lidar
com os desafios do crescimento de dados mediante a redução efetiva da
quantia de dados que precisam ser gerenciados.
Os administradores de armazenamento
continuam enfrentando uma taxa enorme
de crescimento de dados, mas não recebem
os recursos necessários para gerenciar tudo isso.
As pressões crescentes sobre os
administradores de armazenamento
Os administradores de armazenamento estão na linha de frente
dessa batalha. Conforme os dados crescem, são desafiados a concluir
operações de backup dentro das janelas de backup estabelecidas –
mesmo com os requisitos de negócios diminuindo os tempos
concedidos. Consequentemente, alguns dados talvez não passem
por backup, ficando perigosamente desprotegidos.
Mais dados no sistema de backup significa mais tempo para se
recuperar quando algo dá errado. Isso se soma ao tempo de
indisponibilidade, o que aumenta o risco de perder oportunidades de
receita. E, evidentemente, se não for feito um backup apropriado dos
dados, estes não podem ser recuperados – precisarão ser recriados ou
serão perdidos para sempre.
Software IBM 3
Uma das soluções para todo este crescimento de dados consiste em
simplesmente comprar mais armazenamento. O custo do armazenamento
propriamente dito tem caído com o passar do tempo; portanto, não é tão
doloroso. Entretanto, os custos com acomodação, energia, refrigeração e
gereciamento de todos esses dispositivos não param de crescer, especialmente
conforme novos tipos e modelos de sistemas de armazenamento são incluídos.
Além disso, naturalmente, seu negócio está sempre mudando.
Os administradores de armazenamento precisam se adaptar às muitas
mudanças em seus ambientes, que vão desde colocar novos aplicativos
e origens de dados online a assimilar dados e sistemas de fusões e
aquisições, assim como manter-se em conformidade com novos
mandatos corporativos e governamentais de gerenciamento de dados.
A IBM pode ajudá-lo a construir uma infraestrutura de gerenciamento de
armazenamento mais inteligente que permitirá lidar com todos esses
desafios. Temos soluções para ajudá-lo a reduzir sua área de cobertura de
armazenamento de dados, além de auxiliá-lo a:
Reduzir seus custos de capital e operacionais mediante a
menores requisitos de armazenamento.
Melhorar a disponibilidade de seus aplicativos e seus níveis de
serviço com a redução do tempo de inatividade.
Mitigar os riscos competitivos associados à perda de dados em
um ambiente que muda rapidamente.
A IBM tem uma abordagem holística para
redução de dados, fornecendo soluções para
backups eficientes, armazenamento em
camadas e desduplicação de dados.
Sobrevivendo ao crescimento dos dados:
Opções para uma redução efetiva de dados
A IBM tem uma abordagem holística à redução de dados, ao contrário dos
concorrentes, que oferecem soluções pontuais para problemas que, na verdade,
eles mesmos podem estar causando. Um dos fatores que mais contribui para o
crescimento de dados é, por exemplo, a duplicação repetida de grandes
quantidades de dados sempre que se realiza um backup “full”.
Na abordagem holística da IBM, uma opção é evitar o crescimento dos
dados a partir da duplicação desnecessária de dados; para tanto, é feito
backup somente dos dados que mudaram desde o backup anterior. Outra
opção é determinar quais tipos diferentes de dados há e categorizá-los para
que seja possível gerenciá-los de modo mais efetivo, movendo os dados
acessados com menos frequência para camadas de armazenamento mais
baratas, além de mover automaticamente os dados mais antigos para a camada
certa de armazenamento e excluir os que se tornaram desnecessários ou
indesejados. Isso abreviará os ciclos de backup e melhorará o desempenho dos
aplicativos. Finalmente, podemos comprimir e deduplicar os dados que são
colocados em seus sistemas de proteção e retenção de dados.
O portfólio do IBM® Tivoli® Storage Manager
permite backups somente incrementais que evitam
a desduplicação desnecessária dos dados.
Evitando a duplicação de dados
A ideia é tratar a causa do problema, não os sintomas. Se sua taxa semanal
de modificação de dados é de 10%, isso significa que 90% dos seus dados
não mudaram esta semana. Se fizer um backup “full” de tais dados neste
fim de semana, você duplicará quase tudo aquilo de que fez backup no fim
de semana passado. Além de ocupar muita capacidade de armazenamento,
isso também toma bastante tempo – e esses problemas só pioram à medida
que mais dados são criados.
Não é surpresa que os produtos de desduplicação de dados tenham se
tornado tão populares, pois foram criados para eliminar todos os dados
duplicados a partir de backups “full”s repetidos. Quando afirmam que
podem reduzir sua área de cobertura de armazenamento de backup em
90% ou mais, é exatamente a esses dados que se referem.
Mas se não fosse preciso fazer outro backup “full” após o inicial? Se
você fizesse backup apenas dos dados novos e modificados – sempre –,
não criaria todos os dados duplicados que precisam de uma solução de
desduplicação cara para serem desfeitos. Os benefícios de eliminar o
backup “full” semanal incluiriam janelas de backup mais curtas, menor
necessidade de armazenamento e redução dos custos de aquisição de
armazenamento.
4
Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura
A IBM tem soluções mais inteligentes que podem ajudar a prevenir
a necessidade de realizar backups “full”s. Os produtos do portfólio do
IBM Tivoli Storage Manager para gerenciamento de recuperação
unificado fornecem backups somente incrementais.
“full” + diferencial
Backup – Exige um backup “full” e, em seguida, backups
diferenciais com o passar do tempo – geralmente, um backup “full”
a cada fim de semana, com backups diferenciais nos seis dias
seguintes. Isso significa que todos os dados que foram modificados
desde o último backup “full” passarão por um novo backup. Supondo
uma taxa de modificação diária de 10%, será feito um backup de
100% (“full”) no primeiro dia, 10% no segundo, 20% no terceiro,
30% no quarto, 40% no quinto, 50% no sexto e 60% no sétimo. Isso
significa fazer backup de 260% de seus dados a cada semana! Você
precisará de uma capacidade de produção 10 vezes maior para apenas
um mês de backups.
Restauração – O último backup “full” seria restaurado e, em seguida,
o último backup diferencial, até a data da restauração. Este modelo é
mais rápido e confiável que o “full” + incremental, mas com o custo de
uma capacidade de armazenamento muito maior.
O IBM Tivoli Storage Manager faz backup dos arquivos que foram
modificados desde o backup anterior; no caso de arquivos maiores,
como enormes bancos de dados, pode realizar backups de subarquivos,
copiando somente as seções do arquivo que foram modificadas.
O IBM Tivoli Storage Manager FastBack® vai ao próximo nível,
fazendo backup apenas dos blocos individuais de dados que foram
modificados à medida que são gravados no disco. E pelo fato de
fazer backups sem impactar os aplicativos, pode fazê-los com mais
frequência, o que significa menos dados com risco de serem perdidos.
O IBM Tivoli Storage Manager FastBack for Workstations protege
continuamente os dados em computadores de área de trabalho e
laptops, copiando, mais uma vez, somente os arquivos novos ou
que foram modificados.
Incremental progressivo
O IBM Tivoli Storage FlashCopy® Manager aproveita tecnologias
de captura instantânea incrementais com base em hardwares e
Backup – Exige um backup “full” na primeira vez em que o backup
softwares para proporcionar proteção de dados e recuperação de
é feito e, em seguida, somente backups incrementais. Não ocorrem
aplicativos rápidas e eficientes.
transferências extras de dados, o que economiza largura de banda de rede
Metodologias de Backup
e tempo de transferência, acelera o backup e a restauração e pode
“full” + incremental
economizar muitos milhares de dinheiro em custos de disco e fita.
Restauração – É preciso escolher o ponto a partir do qual deseja
Backup – Exige um backup “full” e, em seguida, backups incrementais com o
restaurar e, em seguida, restaurar os arquivos necessários somente
passar do tempo – geralmente, um backup “full” a cada fim de semana, com
uma vez. É um método muito mais rápido e confiável que os
backups incrementais nos seis dias seguintes. Somente os dados que foram
outros dois.
modificados a partir do dia anterior são transferidos para a fita. Então, no
final da semana, outro backup “full” precisa ser executado.
A metodologia exclusiva de backup incremental
Restauração – O último backup “full” deve ser restaurado e, em
seguida, os dados incrementais de cada dia são aplicados a ele. Isso
progressivo do Tivoli Storage Manager pode
significa que, se tiver um backup “full” e três backups incrementais
economizar terabytes de capacidade de backup por mês.
do mesmo arquivo, este será restaurado quatro vezes. É um
desperdício de tempo e dinheiro; além disso, gera riscos.
Software IBM 5
Backup incremental progressivo com Tivoli Storage Manager
Um banco de dados relacional IBM DB2® interno permite que o
Tivoli Storage Manager realize backups incrementais progressivos,
porque rastreia cada arquivo individual e sabe exatamente como seus
sistemas estão a cada dia. Quando há necessidade de restauração,
somente a versão do arquivo necessário é restaurada. Ao contrário de
outras soluções de backup com base em arquivo que requerem a
execução de backups “full”s periódicos (normalmente semanalmente)
para assegurar tempos de recuperação razoáveis, a metodologia
exclusiva de backup incremental progressivo nunca requer a execução
de outro backup “full” depois que o primeiro é feito para configurar
a base. O resultado, conforme mostrado na Figura 1, pode ser uma
economia de muitos terabytes de capacidade de backup todos os meses.
2500
Gigabytes
2000
1500
1000
500
Seg
Ter
Qua
Qui
Semana 1
Fornecedor A:
“full” + Diferencial
Sex
Fim de Seg
Semana
Fornecedor B:
“full” + Incremental
Ter
Qua
Qui
Sex
Semana 2
Fim de
Semana
Tivoli Storage Manager:
Incremental progressivo
Figura 1: A metodologia de backup incremental progressivo do Tivoli Storage
Manager pode poupar muitos terabytes de capacidade de backup.
Capacidade de Backup Necessária para Um Mês:
Fornecedor A
26 TB
Fornecedor B
14 TB
Tivoli Storage Manager
7 TB
O banco de dados interno do Tivoli Storage Manager também
proporciona outras economias de custo, por meio de escalabilidade,
desempenho e confiabilidade excelentes. Atualmente, o banco de dados
é suportado para gerenciar quatro bilhões de objetos de dados (arquivos
e blocos de arquivos deduplicados) em um único Tivoli Storage Manager
Server. Não há necessidade de servidores de mídia caros e complexos
adicionais, conforme exigido por produtos da concorrência para atender
às necessidades até mesmo dos maiores datacenters.
A movimentação de dados para camadas mais
baratas de armazenamento e a exclusão de dados
desnecessários do ambiente podem reduzir a
necessidade de capacidade de armazenamento
primário e podem facilitar o gerenciamento e
proteção de dados.
Comparação dos Requisitos de Capacidade
0
A análise mostrada na Figura 1 começa com 2 TB de dados e adiciona
ou modifica 200 GB por dia. Assume-se que um backup “full” já foi
realizado para definir a base.
Categorizando dados e automatizando
a migração e a exclusão
Outra opção para reduzir a área de cobertura do armazenamento de
dados é avaliar os diferentes tipos de dados e onde eles estão no seu
ciclo de vida. Se sua organização é como a maioria das demais, todos
os seus dados não estruturados estão em sistemas de arquivos simples,
que provavelmente estão cheios de dados que você raramente – ou
nunca – precisa acessar. Isso pode incluir dados que você não é mais
obrigado a manter, seja por lei ou política, mas que não excluiu – como
arquivos de projetos e funcionários antigos –, que poderiam custar caro
se descobertos em procedimentos legais.
O objetivo é identificar quais dados podem ser movidos para camadas
de armazenamento mais baratas e quais podem ser excluídos inteiramente
do ambiente e, em seguida, automatizar o processo. Isso reduzirá
6
Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura
a necessidade de comprar mais capacidade de armazenamento primário e
facilitará o gerenciamento e a proteção daquilo que você tem. O desempenho
do backup e da restauração melhorará; além disso, ficará mais fácil comprovar
que as políticas de retenção e expiração de dados estão sendo cumpridas.
A IBM oferece o IBM Tivoli Storage Productivity Center for Data
para tal finalidade (vide Figura 2). Essa solução relata onde estão seus
dados, separados por datas de acesso ou em que foram salvos, a quem
pertencem, o aplicativo que os criou e diversos outros filtros. Com a
inteligência adquirida a partir de tais relatórios, é possível configurar
políticas significativas em seu software de gerenciamento de dados
para tomar automaticamente a ação apropriada em relação a dados
que não deveriam estar ocupando seus sistemas primários. O Tivoli
Storage Productivity Center for Data também pode ajudar a identificar
e eliminar dados duplicados, dados órfãos, dados temporários e dados
que não são de negócios.
Exemplo de Relatório de Resumo de Dados do
Tivoli Storage Productivity Center for Data
Figura 2: O Tivoli Storage Productivity Center for Data pode ajudá-lo a entender melhor seus dados, permitindo categorizá-los e gerenciá-los de maneira mais efetiva.
Software IBM 7
As soluções do Tivoli Storage Manager movem
automaticamente dados para outras mídias com
base nas políticas configuradas, liberando um
espaço valioso em disco para arquivos ativos.
A família Tivoli Storage Manager inclui duas soluções para automatizar
a migração de dados entre diversas camadas de armazenamento: IBM
Tivoli Storage Manager for Space Management, que é para servidores
IBM AIX®, HP-UX, Sun Solaris e Linux, e o IBM Tivoli Storage
Manager HSM for Windows, que é para servidores Microsoft Windows.
Essas soluções trabalham de forma transparente no plano de fundo,
automaticamente selecionando e movendo arquivos de camadas de
armazenamento primário para secundário com base nos critérios de política
definidos, como tamanho do arquivo ou tempo transcorrido desde que um
arquivo foi aberto. Deixam um ponteiro, ou arquivo stub, onde os dados
foram armazenados originalmente para que os usuários e aplicativos não
precisem se preocupar com o local onde os dados foram armazenados; a
solução roteia novamente, com transparência, a solicitação de quaisquer
arquivos movidos. Não aparecerão mais mensagens de falta de espaço em
disco. As soluções do Tivoli Storage Manager movem dados automaticamente
para a mídia adequada com base nas políticas definidas, liberando espaço
valioso em disco para arquivos ativos e proporcionar acesso automatizado aos
arquivos migrados quando necessário.
Migrações são programadas para minimizarem o tráfego de rede
durante horários de pico.
Migrações automáticas que ocorrem fora da janela de backup.
As soluções de migração de dados do Tivoli Storage Manager
não somente ajudam a limpar os sistemas de armazenamento primário,
como também podem ser usadas para mover dados mais facilmente para
novas tecnologias de armazenamento, conforme são implementadas
(veja a Figura 3). A migração de arquivos para o Tivoli Storage Manager
ajuda a acelerar as restaurações, já que não há necessidade de restaurar
arquivos migrados em caso de desastre.
Tivoli Storage Manager Hierarchy of Storage
Disk pools
Virtual tape
Tape pools
App Servers
Prod. Data
Tivoli Storage
Manager Server
Figura 3: As soluções de gerenciamento de espaço do Tivoli Storage Manager
podem ajudar a reduzir os custos de armazenamento e administração.
O uso do Tivoli Storage Manager para permitir a utilização mais
As soluções de migração de dados do Tivoli Storage Manager ajudam os clientes eficiente do armazenamento pode ajudá-lo a:
a controlarem, e gerenciarem com eficiência, o crescimento de dados e os custos
de armazenamento associados mediante o fornecimento de gerenciamento
Melhorar os tempos de resposta dos servidores de arquivos mediante
automatizado do espaço. Essas soluções oferecem os seguintes recursos importantes: a transferência de dados inativos.
Mover arquivos de baixa atividade ou inativos para uma hierarquia
A "virtualização" do “storage pool” ajuda a maximizar o uso dos
de armazenamento de menor custo.
recursos de armazenamento do Tivoli Storage Manager.
Explorar mais profundamente os ativos de armazenamento existentes.
O gerenciamento da restauração é otimizado com base na
Reduzir os tempos de backup e a utilização de recursos ao concentrar
localização dos dados na hierarquia.
somente em arquivos ativos.
A migração é transparente para os usuários e aplicativos.
Eliminar atividades de limpeza manual de sistemas de arquivos.
8
Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura
Arquivamento de informações
O arquivamento é outra técnica importante de redução de dados para
certos tipos de dados. Exemplos incluem dados históricos de relatórios
financeiros e registros médicos que precisam ser retidos para referência
futura, mas não precisam consumir espaço valioso em disco onde deveria
haver dados ativos. Registros médicos e históricos de declarações de clientes
também se encaixam com frequência nessa categoria.
O arquivamento é para a retenção de registros em longo prazo.
Ele difere do backup porque mantém os arquivos por um período
específico (enquanto o backup mantém determinado número de
versões de um arquivo) ao mesmo tempo que remove os dados de
sistemas de armazenamento de produção primários completamente.
Os principais recursos das soluções de arquivamento da IBM incluem:
Armazenamento de longo prazo em mídias com custo reduzido.
Cópias pontuais que fornecem histórico de revisão e permitem
auditoria.
Desduplicação de dados para remover cópias redundantes de dados.
Impingir políticas de período de retenção e "espera de retenção".
Processamento rápido da expiração.
A IBM oferece opções de soluções para
arquivamento, dependendo das preferências do
cliente e requisitos para retenção de registros em
longo prazo.
A IBM oferece opções de soluções para arquivamento, dependendo
das preferências do cliente e dos aplicativos envolvidos (vide Figura 4).
O Tivoli Storage Manager inclui um recurso de arquivamento integrado
diretamente no software de backup do cliente. É baseado em políticas,
o que permite que o administrador configure os tempos de retenção.
Se o requisito de tempo de retenção de um arquivo mudar, o
administrador precisa apenas atualizar a política, enquanto o software
atualizará retroativamente os arquivos já arquivados; não é necessário
restaurar e rearquivar, como exigem algumas ofertas da concorrência.
O Tivoli Storage Manager também oferece a opção de integrar dados
de muitos aplicativos diferentes em seu repositório de arquivos; o
repositório de arquivos pode ser um conjunto virtualizado de sistemas
de armazenamento heterogêneos.
Soluções de Arquivamento da IBM
Arc
hiv
e
e
hiv
App Servers
App Servers
ve
Acelerar o tempo de recuperação do servidor de arquivos mediante
a movimentação de arquivos arquivados e cópias de arquivos para
uma hierarquia de armazenamento de menor custo.
Reduzir os tempos de backup e a utilização de recursos ao
concentrar somente em arquivos ativos.
Localizar informações históricas facilmente usando arquivos
arquivados que são indexados com metadados descritivos.
Ar
c
O uso de soluções de arquivamento da IBM para a retenção de
registros pode ajudá-lo a:
Re
tri e
Re
tri e
ve
Disk pools
Virtual tape
Tivoli Storage
Manager Server
Tape pools
IBM Information
Archive
Figura 4: As soluções de arquivamento da IBM incluem Tivoli Storage Manager
e IBM Information Archive.
Software IBM 9
O IBM Information Archive, que contém uma versão especializada
do Tivoli Storage Manager denominada IBM System Storage®
Archive Manager, é um aplicativo de arquivamento independente
que ingere dados diretamente a partir de mais de 40 aplicativos, incluindo
sistema de mensagens, imagens médicas e de saúde, design e engenharia,
gerenciamento de documentos e outros. Pode impingir políticas de
retenção flexíveis por meio de sua arquitetura de "coleções" exclusiva
e proporciona segurança e integridade de dados no longo prazo.
O IBM Optim™ Data Growth Solution é
uma solução exclusiva de arquivamento de
banco de dados que migra com transparência
registros desnecessários de tabelas de bancos de
dados para armazenamento secundário.
Arquivamento de banco de dados com IBM Optim e
Tivoli Storage Manager
O IBM Optim Data Growth Solution é uma solução exclusiva de
arquivamento de banco de dados que migra com transparência
registros desnecessários de tabelas de bancos de dados para
armazenamento secundário. Como as soluções de gerenciamento de
espaço e arquivamento do Tivoli Storage Manager, o Optim oferece
aos administradores de bancos de dados e armazenamento uma série
de benefícios de custo e desempenho.
Também há benefícios relacionados ao uso do Tivoli Storage
Manager em conjunto com o Optim, que trabalha de maneira
continua com a interface de programas aplicativos (API) do Tivoli
Storage Manager a fim de mover registros de bancos de dados
arquivados diretamente para a hierarquia de armazenamento do
Tivoli Storage Manager, criando uma solução de arquivamento e restauração
em só uma etapa. Com qualquer outro produto de backup/restauração baseado
em arquivo, o Optim utiliza operações de arquivo padrão para armazenar/arquivar
dados em um sistema de arquivos baseado em disco e, em seguida, o produto de
backup pode fazer backup do arquivo para a mídia de backup suportada.
O uso do Optim e do Tivoli Storage Manager em conjunto permite:
Arquivar dados diretamente em disco e fita ou fazer com que o Optim
use o Tivoli Storage Manager para migrá-los automaticamente para fita.
Fazer backup de dados arquivados do Optim incrementalmente para um
storage pool do Tivoli Storage Manager que poder ser gerenciado pelo
Tivoli Storage Manager para disponibilidade local, recuperação de
desastre ou área segura remota.
A desduplicação de dados foi criada para reduzir
os requisitos de capacidade de armazenamento de
dados mediante a eliminação de dados duplicados
a partir de diversos sistemas de origem.
Deduplicando e comprimindo o que
sobrou
Se estiver utilizando uma solução de backup que requer backups “full”s
periódicos, a desduplicação de dados certamente ajudará a diminuir a
quantia de dados gerenciados. Do contrário, a taxa de redução que é
possível esperar a partir da desduplicação dependerá de seu ambiente de
backup específico. A desduplicação de dados foi criada para reduzir os
requisitos de capacidade de armazenamento de dados. Alguns dos dados
duplicados existem em diversos sistemas de origem, mas a maioria da
duplicação é causada pelo armazenamento de conjuntos de backups
“full” repetitivos.
10 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura
A ideia básica por trás da desduplicação de dados é armazenar somente
uma cópia de qualquer objeto de dados e colocar ponteiros para a cópia
única sempre que as duplicatas forem eliminadas (vide Figura 5).
Algumas soluções fazem isso em nível de arquivo, de forma que os
arquivos precisam ser exatamente os mesmos a serem deduplicados.
Com frequência, tal processo é chamado de armazenamento de instância
única (SIS). Outras soluções deduplicam dados com extensão de bloco
fixa ou variável. As soluções da IBM utilizam uma abordagem mista
baseada no tamanho dos dados – baseada em arquivo para arquivos
menores e de bloco variável para arquivos maiores. A maioria das
soluções de desduplicação executa uma combinação de algoritmos de
soma de verificação em relação aos dados selecionados para criar uma
assinatura hash e, a seguir, verificar se tal assinatura já foi vista antes. Em
caso afirmativo, os dados são descartados e, em seu lugar, coloca-se um
ponteiro para os dados já armazenados. Um pequeno número de soluções
sofisticadas, incluindo os sistemas System Storage ProtecTIER® da IBM,
realiza uma comparação diferencial completa dos dados em nível de byte
para remover todo o potencial de "colisões de dados", nas instâncias
extremamente raras em que dois blocos distintos possam compartilhar
a mesma assinatura hash.
Desduplicação de Dados
Data Store
Data Store
Data Store
1. Data chunks are
evaluated to determine a
unique signature for each
2. Signature values are
compared to identify all
duplicates
3. Duplicate data chunks
are replaced with pointers
to a single stored chunk,
saving storage space
Figura 5: A desduplicação de dados reduz a quantia de dados que precisam
ser gerenciados mediante a criação de apenas uma cópia de qualquer objeto
de dados e a substituição de duplicatas com ponteiros para tal cópia única.
A desduplicação de dados pode ocorrer – e realmente ocorre – em muitos
pontos ao longo do ciclo de vida de criação e gerenciamento dos dados.
Em geral, esses pontos de desduplicação podem ser divididos em lado de
origem, onde os dados são criados, e lado de destino, onde são armazenados
e gerenciados. Os aplicativos de backup podem, por exemplo, realizar
desduplicação no lado de origem ao não transferir dados cujo backup
foi feito anteriormente na LAN ou WAN, economizando largura de banda.
No lado de destino, o uso mais popular da desduplicação acontece em
bibliotecas de fita virtual ou VTLs. Esses sistemas baseados em disco
emulam bibliotecas de fita e unidades, mas aplicam a desduplicação para
armazenar quantias equivalentes de dados em disco com custo bastante
reduzido, enquanto oferecem vantagens de desempenho em relação à
fita. Fazer a desduplicação em sistemas baseados em fita é considerado
uma má ideia exceto quando o conjunto de dados inteiro pode ser
armazenado em um único cartucho de fita; seria muito difícil garantir a
manutenção dos dados originais para todos os ponteiros em diversas fitas.
Atualmente, a IBM oferece duas soluções de desduplicação de dados
atraentes. O Tivoli Storage Manager inclui recursos de desduplicação
de dados de origem e de destino. No lado de origem, o agente de backup
decide se enviou um bloco de dados ao servidor de backup no passado;
em caso afirmativo, não o envia novamente. A seguir, também pode
interrogar o servidor de backup para determinar se outro cliente fez
backup do mesmo bloco. O resultado líquido é uma redução dos dados
enviados pela rede, acelerando o processamento do backup.
Ambientes de servidores virtualizados, como o VMware vSphere,
normalmente contêm uma grande quantia de dados duplicados, considerando
o aspecto comum da maioria das imagens de máquina virtual. Ao utilizar
Software IBM 11
o Tivoli Storage Manager for Virtual Environments ou o Tivoli Storage
Manager FastBack para proteger essas máquinas virtuais, a desduplicação
integrada de dados consegue diminuir consideravelmente a quantia de
dados que passam por backup e são transferidos pela rede, especialmente
no caso de backups de imagem “full”s.
Em seguida, o Tivoli Storage Manager realiza a desduplicação de dados no
lado de destino como um processo posterior no Tivoli Storage Manager
Server. Isso foi comprovado em testes de laboratório com o objetivo de
reduzir em até 40% a quantia de dados em conjuntos de armazenamento
em disco. Após a execução, ele recupera automaticamente o armazenamento
que foi liberado. Além de reduzir os requisitos de armazenamento, também
é possível armazenar mais versões de backup em disco para acelerar as
operações de recuperação, ao invés de recuperar a partir da fita.
A outra solução de desduplicação de dados é a família IBM System
Storage ProtecTIER de sistemas de fita virtual para a redução de
dados com diversas origens, incluindo servidores Tivoli Storage
Manager, backups de outros sistemas de backup ou soluções de
software de arquivamento. O ProtecTIER realiza uma desduplicação
em linha extremamente rápida e pode ser comprado como um
subsistema “full” ou como um gateway para seus dispositivos de
armazenamento existentes.
Os recursos de desduplicação do Tivoli Storage
Manager ajudam a reduzir os tempos de
recuperação ao possibilitar o armazenamento
de mais dados de backup em disco ao invés de fita.
Economizando dinheiro com a desduplicação
do Tivoli Storage Manager
Os recursos de desduplicação de origem e destino do Tivoli Storage
Manager funcionam com dados de origens que incluem backups normais,
dados importados pelo Tivoli Storage Manager API e dados de arquivos
e de HSM e são incluídos sem custos adicionais. O Tivoli Storage
Manager deduplica conjuntos de dados baseados em disco como um
processo posterior, de maneira que não haja impacto no desempenho
de backup.
Quando utilizada como parte do Tivoli Storage Manager Suite for
Unified Recovery, um conjunto de dez produtos do Tivoli Storage
Manager que é precificado de acordo com a quantia de dados gerenciados,
a desduplicação pode reduzir consideravelmente os custos totais da
solução de backup.
“Tape reclamation” é outra forma do Tivoli Storage Manager
aumentar o ROI, por meio da utilização inteligente de fitas. Com
o tempo, os arquivos contidos na fita irão expirar, deixando pedaços
de espaço “inúteis” que não podem ser reutilizados. Ao invés de ter
de esperar até que todos os dados da fita expirem, é possível configurar
uma política no Tivoli Storage Manager para mover, com base na
porcentagem de espaço inútil, os dados de qualidade remanescentes
para outra fita – consolidando, assim, os dados de qualidade e liberando
as outras fitas para serem reutilizadas. O Tivoli Storage Manager
também se distingue dos demais porque realiza o “reclamation”
automaticamente para os volumes que serão levados para fora da
empresa. Para tanto, cria um novo conjunto de fitas para serem levadas
para fora e, em seguida, busca o antigo conjunto de fitas externas para
reutilizá-las.
12 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura
O uso do recurso de “reclamation” de fita do Tivoli Storage
Manager permite:
Reduzir os custos por meio de utilização melhor das fitas.
Monitorar constantemente a utilização das fitas.
Estabelecer limites de recuperação definidos pelo usuário.
Planejar para que a recuperação ocorra em horários especificados
ou quando o espaço livre chegar a um limite.
Retornar as fitas originais para o “scratch pool”.
O IBM System Storage ProtecTIER realiza
comparação diferencial em nível de byte para
assegurar que o dado é duplicado, garantindo
a integridade dos mesmos em nível corporativo.
Deduplicando com a Família IBM System Storage
ProtecTIER TS7600
O IBM System Storage ProtecTIER é uma tecnologia líder em
desempenho, escalabilidade, integridade de dados e confiabilidade.
É a solução mais rápida no mercado para ambientes de clientes reais.
Um único sistema ProtecTIER pode escalar facilmente em termos
tanto de desempenho (2000 MBps) quanto de capacidade (1 PB).
Além disso, o ProtecTIER inclui todos os melhores componentes da
IBM, ao contrário das peças baratas de OEM encontradas em
produtos da concorrência.
Escolhendo entre ProtecTIER e Tivoli
Storage Manager
O Tivoli Storage Manager e o ProtecTIER ajudam a reduzir os
requisitos de capacidade de armazenamento, os custos operacionais,
o consumo de energia e o TCO; além disso, os dois permitem
recuperações de dados mais rápidas. Escolher qual deles usar para a
desduplicação de dados depende de vários critérios.
A IBM recomenda usar os recursos de desduplicação de dados do
Tivoli Storage Manager nas seguintes condições:
Se houver um único servidor Tivoli Storage Manager.
Para melhorar os tempos de recuperação do Tivoli Storage Manager
mediante o armazenamento de mais dados de backup no disco.
Caso não haja uma grande quantia de dados duplicados nos sistemas
protegidos por diversos servidores Tivoli Storage Manager.
Para obter operações de desduplicação completamente integradas com
o Tivoli Storage Manager e assim que seja possível ter os benefícios da
desduplicação sem precisar adquirir hardwares ou softwares separados.
Para conseguir um gerenciamento de ciclo de vida de ponta a ponta
com requisitos mínimos de armazenamento de dados.
Use o ProtecTIER nas seguintes condições:
Para deduplicar diversos servidores Tivoli Storage Manager
(ou outro backup).
Se precisar do mais alto desempenho, com até 2000 MBps ou mais.
Caso precise de uma grande quantia de dados e precise de capacidade
e desempenho escaláveis.
É necessário desduplicação em linha para evitar o impacto operacional
do processamento posterior.
Você não tem o Tivoli Storage Manager e está realizando backups
semanais “full”s.
Também é possível utilizar o Tivoli Storage Manager e o ProtecTIER
juntos para permitir a desduplicação em diversos pontos dentro de uma
infraestrutura de dados complexa (vide Figura 6).
Software IBM 13
Desduplicação de Dados com o Tivoli Storage Manager e o ProtecTIER
Location A
Location B
Location C
Tivoli Storage
Manager
Other Tape
Application
Servers
Tivoli Storage
Manager Built-in
Deduplication
SAN
IBM ProtecTIER
Figura 6: O Tivoli Storage Manager e o ProtecTIER podem ser implementados juntos para permitir a desduplicação em diversos pontos na infraestrutura de dados.
O amplo portfólio de soluções de redução de
dados da IBM ajuda a solucionar problemas
complexos dos clientes, enquanto serviços de
suporte global de alta qualidade auxiliam
a proteger seus investimentos.
Por que a IBM?
A IBM é a única fornecedora com um conjunto abrangente de
tecnologias de redução de dados. Nosso amplo portfólio de soluções
de redução de dados nos dá a liberdade necessária para solucionar
problemas de clientes com a tecnologia mais efetiva, enquanto nossos
serviços de suporte global de alta qualidade auxiliam a assegurar que
seus investimentos na redução de dados atendam às suas necessidades
no longo prazo. A IBM continua investindo em pesquisa e
desenvolvimento para poder criar e oferecer os recursos avançados
que nossos clientes solicitam.
Como mostrado na Figura 7, a IBM oferece redução de dados em um
portfólio de gerenciamento de recuperação unificado que consiste em
Tivoli Storage Manager, Tivoli Storage Manager FastBack e Tivoli
Storage Manager FastBack for Workstations. Talvez nunca mais seja
necessário realizar outro backup “full”, em qualquer lugar da sua
empresa estendida. O Tivoli Storage Manager também oferece os
melhores recursos de gerenciamento de fita e compressão de dados
para reduzir ainda mais seus requisitos de armazenamento de backup
e arquivamento.
Além disso, a IBM oferece desduplicação de dados integrada ao Tivoli
Storage Manager e à família de dispositivos e gateways ProtecTIER
TS7600. Finalmente, por meio de soluções líderes no segmento de
mercado como o IBM Information Archive, a IBM oferece soluções
de arquivamento integrado para armazenar e gerenciar diversos tipos
de informações de diferentes origens, ajudando as organizações a
atenderem à mais ampla variedade de demandas de retenção.
14 Usando as soluções de redução de dados da IBM para gerenciar mais dados com menos infraestrutura
Próximos passos
quais tecnologias de redução de dados terão o impacto com maior
redução de custo em suas operações. Também é possível solicitar
uma análise abrangente de ROI usando a ferramenta Business
Value Analyst (BVA) da IBM.
A IBM Global Technology Services e os Parceiros de Negócios
IBM estão prontos para ajudá-lo a avaliar sua situação atual e
recomendar os próximos passos. Podemos ajudá-lo a determinar
Escritórios de Filiais
Aplicativos
Datacenter
Clientes
FastBack
Servidores de Arquivos
Tivoli Storage
Manager for Virtual
Environments
Site de D/R
Clientes
TSM B/A
FlashCopy
Manager
Servidores VMware
IBM System
Storage
IBM
Information
Archive
Armazenamento
Externo
Clientes
FastBack
Servidor
FastBack
Servidor
FastBack
WAN
Storage Manager
Tivoli Storage
Manager Server
Camadas de
Armazenamento
Tivoli Storage
Manager Server
FastBack for Workstations
Tivoli Storage Manager
Administration Center
Dados de Produção
Dados de Backup/Arquivamento
Instalação/Upgrade
Monitoramento
Relatórios
Configuração
Configurar Políticas
Executar Backup/Restauração
Dados de Recuperação de Desastre
Figura 7: A IBM oferece redução de dados em um portfólio de gerenciamento de recuperação unificado.
Storage Manager
Dados Deduplicados
Anotações
Para mais informações
A IBM está mais bem preparada para oferecer uma ampla gama de
soluções de gerenciamento de armazenamento, até mesmo para ambientes
de diferentes fornecedores. Podemos ajudá-lo a implementar uma
infraestrutura de armazenamento dinâmico que escala para atender
aos seus requisitos de negócios em transformação.
Para saber mais sobre como as soluções de gerenciamento de
armazenamento IBM Tivoli podem ajudá-lo a abordar suas
preocupações de gerenciamento de dados em seu ambiente, entre
em contato com seu representante de vendas ou Parceiro de
Negócios IBM ou visite ibm.com/software/tivoli/solutions/storage.
Informações adicionais estão disponíveis em
ibm.com/software/tivoli/solutions/reduction.
© Copyright IBM Corporation 2011
IBM Corporation Software Group
Route 100
Somers, NY 10589
EUA
Produzido nos Estados Unidos da América
Outubro de 2011
Todos os Direitos Reservados
IBM, o logotipo da IBM, ibm.com, ProtecTIER, System Storage e Tivoli são
marcas registradas da International Business Machines Corporation nos Estados
Unidos e/ou em outros países. Se estes ou outros termos de marca registrada da
IBM estiverem acompanhados, em sua primeira referência neste documento, por
um símbolo de marca registrada (® ou ™), tal símbolo indica marca registrada ou
de direito consuetudinário da IBM nos EUA no momento da publicação. Tais
marcas registradas também podem ser marcas registradas ou de direito
consuetudinário em outros países. Uma lista atualizada das marcas registradas da
IBM está disponível na web em “Copyright and trademark information”, em
ibm.com/legal/copytrade.shtml
Linux é uma marca registrada de Linus Torvalds nos Estados Unidos e/ou
em outros países.
Microsoft e Windows são marcas registradas da Microsoft Corporation nos
Estados Unidos e/ou em outros países.
Outros nomes de empresas, produtos e serviços podem ser marcas registradas
ou de serviço de terceiros.
As referências a produtos e serviços da IBM feitas nesta publicação não
significam que a IBM pretenda disponibilizá-las em todos os países onde
a IBM atua.
Nenhuma parte deste documento deve ser reproduzida ou transmitida de
qualquer forma sem a permissão por escrito da IBM Corporation.
O cliente é responsável por assegurar sua própria conformidade com os
requisitos legais. É de total responsabilidade do cliente obter assessoria jurídica
competente a respeito da identificação e interpretação de quaisquer leis e
regulamentos aplicáveis que possam afetar os negócios do cliente e quaisquer
ações que o cliente possa precisar tomar para cumprir essas leis. A IBM não
oferece conselho jurídico nem representa ou garante que seus produtos ou
serviços irão assegurar que o cliente esteja em conformidade com qualquer
lei ou regulamento.
Os dados dos produtos foram revisados em relação à sua precisão na data da
publicação inicial. Os dados estão sujeitos a alterações sem qualquer aviso prévio.
Todas as declarações relacionadas à direção e propósitos futuros da IBM estão sujeitas
a mudanças ou retirada sem aviso prévio e representam metas e objetivos apenas.
As informações fornecidas neste documento são distribuídas "no estado em que
se encontram", sem qualquer garantia, seja expressa ou implícita. A IBM não oferece
quaisquer garantias de comerciabilidade, aptidão para um fim específico ou não infração.
Os produtos IBM possuem garantia de acordo com os termos e condições dos
acordos (por exemplo, IBM Customer Agreement, Declaração de Garantia
Limitada, Contrato de Licença do Programa Internacional, etc.) conforme os
quais são fornecidos.
Recicle
TIW14046-USEN-01
Download

A IBM tem uma abordagem holística para redução de dados