Instituto Superior de Engenharia do Porto
Engenharia de Informática
Ramo de Computadores e Sistemas
Ferramentas e
estratégias de Backup
e manutenção em
ambientes
heterogéneos
Setembro de 2002
Elaborado por:
Rui Miguel Amorim da Mouta
Orientador:
Eng. Mário Fernandes
Índice
Índice
1. INTRODUÇÃO ______________________________________8
1.1 PORQUÊ FAZER BACKUPS – O QUE ESTÁ EM JOGO _______________10
1.1.1 POUPANÇA SIGNIFICATIVA DE CUSTOS __________________________ 11
1.1.2 MAIOR PRODUTIVIDADE ____________________________________ 11
1.1.3 SIMPLICIDADE PARA OS UTILIZADORES __________________________ 11
1.1.4 UMA INFORMÁTICA MAIS SEGURA ______________________________ 11
1.2 O QUE SE PODE PERDER _______________________________12
1.2.1 O SISTEMA OPERATIVO _____________________________________ 12
1.2.2 AS APLICAÇÕES __________________________________________ 12
1.2.3 AS CONFIGURAÇÕES _______________________________________ 12
1.2.4 A REDE _______________________________________________ 12
1.3 DE QUE FORMA SE PODE PERDER _________________________13
1.3.1 ERROS INVOLUNTÁRIOS ____________________________________ 13
1.3.2 FALHA DE DISCOS ________________________________________ 13
1.3.3 ATAQUES DE VÍRUS _______________________________________ 13
1.3.4 ROUBO________________________________________________ 13
1.3.5 DESASTRES NATURAIS _____________________________________ 14
2. EVOLUÇÃO DOS BACKUPS ____________________________15
2.1
2.2
2.3
2.4
2.5
STANDALONE BACKUP ________________________________16
BACKUP AUTOMÁTICO ________________________________17
LAN BACKUP ______________________________________18
LAN BACKUP DEDICADA _______________________________20
STORAGE AREA NETWORK (SAN) BACKUP ___________________20
3. CONCEITOS E FUNDAMENTOS_________________________23
3.1 BACKUP E ARQUIVO _________________________________24
3.2 COMPROMISSOS DE UM SISTEMA DE BACKUP __________________24
3.3 ESTRATÉGIAS DE BACKUP ______________________________25
3.3.1 A INFORMAÇÃO CRÍTICA ___________________________________ 26
3.3.2 PERIODICIDADE DAS OPERAÇÕES DE BACKUP ______________________ 26
3.3.3 PRAZO DE VALIDADE DA INFORMAÇÃO EM BACKUP __________________ 27
3.4 QUANDO É QUE OS BACKUPS DEVEM SER FEITOS ________________27
3.5 TIPOS DE BACKUP ___________________________________28
3.5.1 BACKUPS COMPLETOS______________________________________ 28
Projecto - Computadores e Sistemas
2
Índice
3.5.2 BACKUPS PARCIAIS _______________________________________ 28
3.5.3 BACKUPS INCREMENTAIS ____________________________________ 29
3.5.4 BACKUPS DIFERENCIAIS ____________________________________ 30
3.6 QUAL É A MELHOR ESTRATÉGIA DE BACKUP ___________________30
3.7 ONDE É QUE OS BACKUPS DEVEM SER GUARDADOS ______________31
3.8 PORQUE É QUE A TAPE É IDEAL PARA FAZER O BACKUP ____________32
3.9 DETERMINAR O NÚMERO NECESSÁRIO DE TAPES _______________32
3.10 DETERMINAR O CUSTO _______________________________33
3.11 COM QUE FREQUÊNCIA AS TAPES DEVEM SER SUBSTITUÍDAS _______33
3.12 TAPES E TEMPO NECESSÁRIOS PARA UM BACKUP _______________34
3.13 TAPES NECESSÁRIAS PARA O PROCESSO DE RESTORE ____________35
3.14 ESQUEMAS DE ROTAÇÃO DE TAPES ________________________36
3.14.1 MEDIA SETS ____________________________________________ 36
3.14.2 ROTAÇÃO SIX-TAPE ______________________________________ 36
3.14.3 GRANDFATHER – FATHER– SON ______________________________ 38
3.14.4 TORRES DE HANOI ______________________________________ 40
3.14.5 QUAL É O MELHOR MÉTODO DE ROTAÇÃO ________________________ 42
3.15 O FILE-BY-FILE E O IMAGE BACKUP ______________________43
3.16 NOVAS TECNOLOGIAS DE BACKUP ________________________44
3.16.1 REAL-TIME BACKUP _______________________________________ 45
3.16.2 OBJECT REPLICATION _____________________________________ 45
4. PLANEAMENTO DE UMA ESTRATÉGIA DE BACKUP _________47
4.1 VOLUME DOS DADOS _________________________________48
4.1.1 TAMANHO TOTAL DOS DADOS _________________________________ 48
4.1.2 TAMANHO DOS DADOS QUE SOFREM ALTERAÇÕES ____________________ 48
4.2 TIPO DE DADOS ____________________________________49
4.3 ESTRUTURA DE FICHEIROS _____________________________49
4.4 ORIGEM DOS DADOS _________________________________50
4.4.1 O SERVIDOR ONDE ESTÃO OS DADOS É O QUE FAZ OS BACKUPS __________ 50
4.4.1 OS DADOS ESTÃO EM CLIENTES REMOTOS _________________________ 51
4.4.2 QUAL É O SUBSISTEMA DE DISCOS UTILIZADO ______________________ 52
4.5 DESTINO DOS DADOS _________________________________53
4.5.1 QUAL SERÁ O SUBSISTEMA DE TAPES ____________________________ 53
4.5.2 COMO ESTÃO DISTRIBUÍDAS AS DRIVES DE TAPE ____________________ 53
4.5.3 AMBIENTE QUE RODEIA AS TAPE _______________________________ 54
4.6 O TRAJECTO DOS DADOS_______________________________55
4.6.1 ESTÃO OS DADOS E AS TAPE NO MESMO LOCAL DO SERVIDORES DE BACKUP? _ 55
4.6.2 ESTÃO OS DADOS E OS SERVIDORES DE BACKUP DISTRIBUÍDOS PELA REDE? _ 56
4.7 CONDIÇÕES DE BACKUP NA EMPRESA _______________________57
4.7.1 QUAL É A JANELA DE BACKUP? ________________________________ 57
4.7.2 QUAL É O IMPACTO ACEITÁVEL AO FAZER UM BACKUP? ________________ 58
4.7.3 QUE PREOCUPAÇÕES RELATIVAMENTE À DISPONIBILIDADE DEVE VISAR A
SOLUÇÃO? ______________________________________________ 59
4.8 EXPECTATIVAS _____________________________________60
4.8.1 COMPRESSÃO ___________________________________________ 60
Projecto - Computadores e Sistemas
3
Índice
4.8.2 OVERHEAD _____________________________________________ 61
4.8.3 PERFORMANCE DO RESTORE _________________________________ 61
4.8.4 FACILIDADE DE UTILIZAÇÃO E NECESSIDADE DE FORMAÇÃO ____________ 62
4.9 MEDIDAS E CÁLCULOS ________________________________62
4.9.1 CAPACIDADE DA REDE______________________________________ 62
4.9.2 CAPACIDADE DO SISTEMA ___________________________________ 64
4.10 CONCLUSÃO ______________________________________64
5. SOLUÇÕES: VANTAGENS & DESVANTAGENS ______________66
5.1 O PONTO DE PARTIDA: BACKUPS DISTRIBUÍDOS _______________67
5.2 O PRIMEIRO PASSO: CENTRALIZAÇÃO DO BACKUP ______________69
5.3 MELHORAR AS OPERAÇÕES DE BACKUP: AUTOMATIZAÇÃO COM TAPES
LIBRARIES _______________________________________71
5.4 MAIORES NECESSIDADES DE PRODUTIVIDADE OPERACIONAL: PARTILHA DE
TAPE LIBRARIES ____________________________________73
5.5 OPTIMIZAÇÃO DOS RECURSOS: LIGAÇÃO POR FC À TAPE LIBRARY ___76
5.6 MINIMIZAR O IMPACTO NA PRODUÇÃO: REDE DEDICADA DE BACKUP __78
5.7 BACKUP E SEGURANÇA CENTRALIZADOS ____________________80
5.8 PROTEGER O FUTURO DO NEGÓCIO – COMPUTADORES PORTÁTEIS E
DESKTOP ________________________________________84
6. FERRAMENTAS DE GESTÃO E MANUTENÇÃO DE BACKUPS ___87
6.1 INTRODUÇÃO ______________________________________88
BRIGHTSTOR ENTERPRISE BACKUP __________________91
VERITAS BACKUP EXEC _______________________________94
ARKEIA 5 _______________________________________101
7. CONCLUSÃO _____________________________________105
8. ANEXOS_________________________________________107
GLOSSÁRIO _________________________________________122
BIBLIOGRAFIA _______________________________________123
Projecto - Computadores e Sistemas
4
Índice
Índice de Figuras
Figura 1 – Backup local a uma workstation _______________________ 16
Figura 2 – Backup através de um servidor ________________________ 17
Figura 3 – Backup automático com ligação do servidor a uma tape library.
_______________________________________________________ 18
Figura 4 – LAN de Backup com ligação a um servidor de backup e deste a
uma tape library. _________________________________________ 19
Figura 5 – Backup feito através de uma LAN secundária dedicada. ____ 20
Figura 6 – Backup de uma SAN através de Fiber Channel. ___________ 21
Figura 7 – Backup local a cada servidor. _________________________ 67
Figura 8 – Backup centralizado num servidor. _____________________ 69
Figura 9 –Backup automatizado com utilização de tape library. _______ 71
Figura 10 – Partilha da tape library a outros servidores. _____________ 73
Figura 11 – Funcionamento da partilha da tape library. _____________ 74
Figura 12 – Ligação por FC à tape library. ________________________ 76
Figura 13 – Rede dedicada de backup. __________________________ 78
Figura 14 – Rede de backup com firewall. ________________________ 81
Figura 15 – Arquitectura Cliente/Servidor. ________________________ 88
Projecto - Computadores e Sistemas
5
Índice
Índice de Tabelas
Tabela 1 – Periodicidade dos backups ___________________________ 27
Tabela 2 – Tipos de backups parciais ____________________________ 29
Tabela 3 – Principais vantagens e desvantagens de backup incremental e
diferencial_______________________________________________ 31
Tabela 4 –Backup diferencial: tapes e tempo necessários ____________ 34
Tabela 5 –Backup incremental: tapes e tempo necessários___________ 34
Tabela 6 –Backup diferencial: tapes necessárias para o restore _______ 35
Tabela 7 –Backup incremental: tapes necessárias para o restore ______ 35
Tabela 8 - Método de rotação Six-Tape num período de um mês ____ 38
Tabela 9 - Método de rotação GFS num período de um mês_________ 39
Tabela 10 – Rotação de tapes pelo método de Torres de Hanoi _______ 40
Tabela 11 - Método Torres de Hanoi num período de um mês ______ 41
Tabela 12 – Comparação dos métodos de rotação _________________ 42
Tabela 13 – Relações de compressão de ficheiros __________________ 61
Tabela 14 – Tecnologias de rede e suas performances ______________ 63
Projecto - Computadores e Sistemas
6
Agradecimentos
Agradecimentos
Este projecto agora concluído foi o culminar de um trabalho, fruto de um
grande empenho, onde a vontade de desenvolver conhecimentos foi a
meta a atingir.
A colaboração de algumas pessoas, as quais cito de seguida, foi essencial
para a elaboração e conclusão deste trabalho:
o Eng. Mário Fernandes - pelo total acompanhamento e apoio neste
projecto.
o Aos colegas, pela paciência, amizade e companheirismo que sempre
demonstraram;
o Aos meus mais queridos, por me ajudarem a chegar até aqui.
Fica também um agradecimento geral a todos que mostraram
disponibilidade, facilitaram o acesso à informação e facultaram material de
apoio.
Projecto - Computadores e Sistemas
7
Capítulo
1
Introdução
Introdução
INTRODUÇÃO
O 11 de Setembro de 2001 mudou o mundo. Na realidade, o mundo não
muda todos os dias daquela forma.
Na área informática este acontecimento mudou entre outras coisas a
percepção sobre segurança. Afinal, as tragédias e acidentes acontecem de
facto. De repente, todas as reuniões, conversas, apresentações e relatórios
sobre backups, segurança, alta disponibilidade, disaster recovery (DR),
fazem mais sentido, quando anteriormente não eram vistas com bons
olhos.
Se nos perguntassem, há algum tempo atrás, qual a probabilidade de tal
acontecer, àquela escala e daquela forma, qual seria a resposta?
Provavelmente zero. Actualmente, os temas do DR e planos de
contingência associados, regressaram às reuniões de administração.
Vários administradores, presidentes e gestores estarão hoje perante um
dilema se por um lado a incerteza e o receio quanto ao futuro aconselha a
contenção nos investimentos em tecnologias de informação, por outro
lado, se estes acontecimentos surgem, a única forma de precaução será
através destes investimentos. Creio que se trata apenas de uma questão
de tempo. Mais ano, menos ano, ver-se-ão na contingência de implementar
um plano de DR.
Por exemplo, nos EUA, um dos requisitos para uma empresa ser cotada em
bolsa, é ter planos de DR. De facto, as infra-estruturas estavam criadas,
imediatamente os planos funcionaram, e a continuidade foi assegurada.
Em Portugal este cuidado também deve ser atendido pois não nos
devemos esquecer que também temos alguns acidentes, tais como a
cegonha que deixou Portugal às escuras. Podemos ser muito criativos na
imaginação de acontecimentos que nunca pensaríamos que pudessem
ocorrer e, de facto, o imprevisto sucede.
A tecnologia permite dar continuidade ao negócio mesmo com uma perda
total dos dados e os principais construtores desta área têm soluções e
serviços para o efeito: arrays de discos com funcionalidades de cópia
remota, software de gestão de backups que permite duplicar cópias
(colocando uma local e outra remota), bibliotecas como repositório de
dados, e as comunicações que permitem ligar todos estes dispositivos a
curtas ou longas distâncias. Por exemplo, hoje podemos transmitir
Gigabytes de informação a quilómetros de distância.
Projecto - Computadores e Sistemas
9
Introdução
É dispendioso ter esta capacidade de continuar a operar com a perda total
de um centro de dados, mas ao contrário do que se possa pensar, não é
tanto por causa do investimento inicial neste tipo de equipamentos. A
operação do serviço, nomeadamente ao nível das comunicações, será a
que absorve a maior parcela dos custos. Os operadores de comunicações
têm aqui um papel determinante. Existem fibras ópticas, linhas ATM, etc,
mas o seu custo continua elevado para a maioria das empresas em
Portugal. A lógica da rentabilidade, de recuperação de investimento deverá
ser sentida como se de um seguro se tratasse. É um custo eventualmente
sem retorno, que depende do risco associado e da dependência do negócio
nas tecnologias de informação (TIs).
É tudo uma gestão de risco. E gestão de risco é saber equilibrar os custos
de prevenção e os custos resultantes de falhas de segurança.
1.1
Porquê fazer backups – O que está em jogo
Actualmente, muitas das empresas não tem capacidade para proteger
adequadamente os seus dados e a maior parte das empresas continuam a
operar sem uma estratégia funcional de backup que assegure a integridade
dos seus dados críticos.
O crescimento dos servidores nas empresas aumentou a dificuldade de se
localizar determinada informação. Além disto, questões operacionais, como
os backups e procedimentos de segurança, tornam-se extremamente
complexos quando falamos em ambientes distribuídos, com dezenas de
máquinas diferentes, com os mais diversos sistemas operativos (NT, Unix,
Netware), cada uma com os seus próprios sistemas de backup.
Numa política de backup, este tipo de ambiente cria problemas e tem
consequências como elevados custos de formação nos diversos sistemas
utilizados, dificuldade em manter a operacionalidade do sistema com
segurança com tantas combinações de diferentes softwares e hardwares,
aumento dos custos com a manutenção do hardware, dispositivos de
escrita/leitura de tapes e dificuldade na realização de testes de verificação
do sucesso dos backups.
A uniformização na empresa do software/hardware de backup diminui
estes problemas e aumenta a segurança de todo o processo de
backup/restore.
Projecto - Computadores e Sistemas
10
Introdução
Investimentos esporádicos em gerações anteriores de software e hardware
de backup para computadores pessoais, provaram serem ineficazes e
inúteis. Contudo, a última geração de software de backup e restore de
computadores, aliada à grande capacidade de armazenamento e
performance dos dispositivos para efectuar backups, permite uma
segurança e uma confiança que anteriormente só era conseguida por
sistemas de mainframe.
Os utilizadores que implementaram uma estratégia de backup numa
empresa identificaram quatro grandes benefícios:
1.1.1
Poupança significativa de custos
Visto que os utilizadores armazenam cada vez mais informação nos
computadores pessoais, o valor dos dados excede rapidamente o valor do
hardware. De facto, a média dos computadores pessoais usados nas
empresas equivale a uma fracção do que custaria recriar os dados
armazenados no computador.
1.1.2
Maior produtividade
Quando um computador ou um dispositivo de armazenamento falha, o seu
utilizador tem de ser capaz de recuperar o trabalho imediatamente. Sem o
backup, o utilizador gasta horas, dias, ou até mesmo semanas a reconstruir
os documentos perdidos. Visto que a produtividade dos utilizadores
diminui, também diminui a produtividade da empresa. Um sistema de
backup fiável protege a informação e mantém a produtividade.
1.1.3
Simplicidade para os utilizadores
Os utilizadores questionados acerca dos backup afirmam que sabem que
deveriam fazer backup mas que não o fazem visto que este dá muito
trabalho. A tecnologia existente hoje em dia retira este fardo ao utilizar
aplicações de backup que através da rede centralizam os backups de redes
completas de computadores.
1.1.4
Uma informática mais segura
Uma vez que cada vez mais tarefas, como produtividade, apresentação e
comunicação estão representadas nos computadores, torna-se essencial
uma estratégia de backup regular. Sem uma base sólida num sistema
informático, uma grande dependência dos computadores conduz a uma
grande vulnerabilidade.
Projecto - Computadores e Sistemas
11
Introdução
1.2
O que se pode perder
Enquanto não se experimentar uma perda de dados, não se tem a noção
exacta da dimensão e dos efeitos que os dados perdidos podem provocar.
Considere-se os documentos, por exemplo. Devido à naturalidade com que
são criados, muitos utilizadores não estão cientes do valor do seu
investimento nesses documentos até os perderem. E os documentos não
são o único tipo de dados que se pode perder. Pense-se em todos os
componentes de um ambiente computacional complexo que também
podem ser perdidos:
1.2.1
O sistema operativo
Os sistemas operativos são complexos, com muitos ficheiros em muitos
directórios. Provavelmente existe uma lista de drivers, fontes,
configurações e outros recursos relacionados com o sistema, que seria
fastidioso ter de voltar a reunir depois de o sistema ir abaixo.
1.2.2
As aplicações
O processo de reinstalação através de discos, CDs e pela Internet é pouco
interessante e excessivamente longo.
1.2.3
As configurações
As aplicações permitem configurações significantes durante e depois da
instalação. Investe-se numa quantidade de coisas, que gradualmente vão
sendo configuradas de forma a que fiquem cada vez melhor. Por exemplo,
uma folha de cálculo, na qual se pode configurar menus, cores,
automatizar troca de dados com outras folhas. No caso de acontecer uma
perda desses documentos, ter de efectuar todas essas configurações de
novo, poderá ser difícil e consumir muito tempo para as recriar.
1.2.4
A rede
Os utilizadores não fazem ideia da complexidade e da fragilidade de
qualquer ambiente em rede. Neste tipo de ambientes interagem vários
componentes de hardware e software com outros equipamentos originais e
produtos third-party.
Projecto - Computadores e Sistemas
12
Introdução
1.3
De que forma se pode perder
Os dados guardados em computadores estão sempre susceptíveis de serem
destruídos. Em todos os tipos de negócios – desde o maior ao mais
pequeno – pode perder-se dados todos os dias. Normalmente, as razões
para tal são:
1.3.1
Erros involuntários
Muitos dos dados perdem-se quando os utilizadores, inadvertidamente,
apagam ficheiros, pastas ou mesmo discos inteiros. Este tipo de erro
involuntário pode resultar por má identificação dos dados, discos
desorganizados, ou experiência inadequada. A estatísticas revelam que a
maioria da perda de dados é causada acidentalmente pelos utilizadores.
1.3.2
Falha de discos
Não se pode dizer que este tipo de situação é frequente, mas ocorre
quando menos se espera. Como quase todos os trabalhadores fazem do
disco do computador da empresa o primeiro dispositivo de
armazenamento, por vezes estão aí armazenados anos de trabalho e, sem
um backup dessa informação, pode perder-se tudo.
1.3.3
Ataques de Vírus
Como resultado da evolução tecnológica, todos estamos cientes do perigo
dos vírus num computador. Este tipo de programas pode expandir-se
sozinho de computador em computador. Por vezes podem não causar
estragos mas, a maior parte das vezes, apagam ficheiros e chegam mesmo
a formatar discos inteiros.
1.3.4
Roubo
Os computadores pessoais são o objecto favorito dos ladrões de
equipamento tecnológico. Muitas organizações perderam todos os
computadores que possuíam numa única noite e, pior do que perder os
computadores é perder a informação que estes contêm, que é, por vezes,
muito mais valiosa.
Projecto - Computadores e Sistemas
13
Introdução
1.3.5
Desastres naturais
A probabilidade de ocorrer um incêndio, uma inundação, um terramoto ou
outro tipo de desastre natural ou provocado, pode causar a perda de toda
a informação.
Resumindo, este documento apresenta uma visão sobre muitas das
questões levantadas na implementação de uma estratégia de backup.
Começando por mostrar a evolução dos backups ao longo dos últimos anos
e apresentando depois alguns conceitos e fundamentos necessários para
compreender tudo o que envolve esta matéria. No capítulo seguinte, são
focados pontos fulcrais que se deve ter em consideração quando se planeia
uma estratégia eficiente de backup. Num capítulo seguinte, são
apresentados cenários de redes onde são aplicados dispositivos de backup
e enunciadas as vantagens e desvantagens de cada um. Por fim são
apresentadas algumas ferramentas usadas na gestão dos backup. Em
anexo são apresentadas algumas opções de hardware disponíveis no
mercado e suas características gerais.
Ah! Já me esquecia! Vou fazer backup ao meu PC...
Projecto - Computadores e Sistemas
14
Capítulo
2
Evolução dos Backups
Evolução dos Backups
A arte do backup de dados desenvolveu-se significativamente nos últimos
anos, tendo-se passado de drives individuais de SCSI que faziam o backup
em computadores pessoais, para sistemas automáticos que fazem o
backup em redes heterogéneas de servidores. O passo seguinte desta
evolução foram as Storage Area Network (SAN).
2.1
Standalone backup
Os sistemas abertos de backup nasceram em 1987 com a introdução da
primeira drive de tapes multi-gigabyte 8mm SCSI. Os discos para as drives
SCSI a gigabyte acabavam de aparecer e estavam a ser usados nas
workstations UNIX e computadores. Neste ambiente, a melhor maneira de
efectuar o backup era ligar directamente a drive de tape SCSI ao
computador e efectuar o backup dos dados.
A grande capacidade de armazenamento das novas tecnologias de tapes
permitiram um backup não vigiado pela primeira vez – eliminando a
necessidade da presença de um administrador de sistemas (normalmente
um engenheiro) que trocava manualmente as tapes à medida que estavam
cheias. Nos primeiros anos, a capacidade de uma tape normal teve
andamento para a capacidade de disco nestes sistemas.
Figura 1 – Backup local a uma workstation
As redes locais apareceram sem demora e os servidores de ficheiros
nasceram. Os dados residentes na workstation individual foram movidos
para estes servidores de ficheiros. A drive de tape foi movida para uma
ligação directa ao servidor e o backup realizado no servidor e não na
workstation. Neste ambiente multi-utilizadores, os dados começaram a
crescer mais rapidamente do que a capacidade de uma tape normal. Os
administradores de sistemas viram-se novamente obrigados a trocar as
Projecto - Computadores e Sistemas
16
Evolução dos Backups
tapes para completarem um backup, o que normalmente acontecia à noite,
quando o sistema estava inactivo.
Drive tape
dedicada ligada
ao servidor
Figura 2 – Backup através de um servidor
2.2
Backup automático
Em 1990 foi introduzido o primeiro sistema “tape library SCSI-based”.
Contendo 120 tapes e uma nova geração de dispositivos para comprimir os
dados, esta tape library expandiu a capacidade de armazenamento em
backup para mais de um terabyte pela primeira vez. Desde então, produtos
automatizados de tapes de todos os modelos e tamanhos foram
introduzidos no mercado. Dispositivos “Low-end autoloaders”, contendo 5 a
7 tapes poderiam fornecer backups não vigiados por um período superior a
uma semana. Tape libraries mais sofisticadas permitiam automatizar os
backups, bem como melhorar a performance e a segurança através do uso
de múltiplas drives de tape. Rapidamente os vendedores de software de
backup adicionaram software para controlo de tape libraries às suas
aplicações. Uma vez mais, o backup completamente automatizado foi
possível.
Projecto - Computadores e Sistemas
17
Evolução dos Backups
Tape library
dedicada ligada a
um servidor
Figura 3 – Backup automático com ligação do servidor a uma tape library.
Durante toda a década de 90, o número de servidores dentro das
empresas cresceu com grande intensidade. Uma combinação de hardware
de baixo custo, novas aplicações cliente-servidor e a Internet resultaram
em servidores UNIX e PC-based, distribuídos por toda a empresa. Com isto,
um novo problema apareceu – como administrar as operações de backup
de uma constelação extensa de sistemas. A administração de backups
tornou-se, uma vez mais, num esforço laboral intenso. Embora o problema
da capacidade pudesse ser automatizado, continuava a haver tarefas
manuais que tinham de ser administradas em cada servidor: assegurar que
havia tapes carregadas, assegurar que o trabalho de backup tinha sido
concluído com sucesso, a etiquetagem e armazenamento de tapes, a
identificação de falhas e outras mais.
2.3
LAN backup
Em breve, a maior parte ou mesmo todos esses servidores ficaram em rede
usando as tecnologias de rede local e WAN. Os desenvolvedores de
software de backup responderam com uma nova classe de aplicações de
backup concebidas para correr ao longo da rede. Estas aplicações de LAN
backup eram capazes de enviar os dados de cada servidor da rede para um
servidor de backup ao qual estava ligado um dispositivo, tal como um tape
library ou um autoloader.
Projecto - Computadores e Sistemas
18
Evolução dos Backups
A LAN backup trouxe várias vantagens:
• Uma tape library normal podia ser partilhada entre os servidores da
rede.
• A capacidade do backup podia ser facilmente escalonada de modo a
conhecer o crescimento de armazenamento.
• A administração foi simplificada.
• Os custos foram reduzidos.
Backup pela rede
usando um servidor de
backup ligado a uma
tape library
Servidor de backup
Figura 4 – LAN de Backup com ligação a um servidor de backup e deste a uma tape
library.
No entanto, também teve inconvenientes:
• As LANs não foram concebidas para serem um interface de
armazenamento de dados de segurança.
• A largura de banda de uma LAN estava limitada a cerca de 10 MB
por segundo, o que resultava em muito tempo de backup.
• A circulação de dados na LAN faz abrandar a operação das
aplicações cliente-servidor ligadas à mesma LAN.
Projecto - Computadores e Sistemas
19
Evolução dos Backups
2.4
LAN backup dedicada
O problema de circulação de dados poderia ser eliminado com a colocação
de uma LAN secundária, dedicada ao armazenamento e ao backup.
Contudo esta solução continua a ter o problema da largura de banda,
faltando também a segurança necessária para backups de dados.
Rede dedicada
Figura 5 – Backup feito através de uma LAN secundária dedicada.
2.5
Storage Area Network (SAN) backup
As SAN são o novo paradigma para ligar e gerir o armazenamento num
ambiente de rede. Uma SAN é uma rede de alta-velocidade dedicada a
fazer o interface de subsistemas de armazenamento aos servidores. A
arquitectura actual das SAN é tipicamente baseada num interface de Fiber
Channel (FC). Um é um interface realizado para fazer a inter-conexão de
centenas de dispositivos numa rede de confiança alcançando dezenas de
quilómetros. Tanto o disco como os sistemas de armazenamento de tapes,
podem ser ligados a uma SAN.
Projecto - Computadores e Sistemas
20
Evolução dos Backups
Aplicações
de gestão
centralizada
LAN
Servidores
Figura 6 – Backup de uma SAN através de Fiber Channel.
Para um backup de rede, uma arquitectura SAN oferece muitos benefícios:
Facilidade de administração:
o O software de gestão centralizado permite uma configuração e
monitorização remotamente.
o Operação não vigiada.
o Gestão de Média pode ser automatizada.
Escalonamento:
o A capacidade pode ser escalonada para se conhecer as necessidades
da rede.
Maior largura de banda:
o Até 2 GB por segundo FC dedicados ao armazenamento.
Alta Performance:
o Liberta toda a capacidade do hardware de armazenamento sem
interferir na performance da LAN.
Projecto - Computadores e Sistemas
21
Evolução dos Backups
Grande segurança e disponibilidade:
o Dispõe de dispositivos redundantes de drives, power, arrefecimento
e capacidade de hot-swap para assegurar confiança e simplificar os
serviços.
Flexibilidade de configuração:
o Com mais de 20 km de capacidade de distância e componentes de
rede flexíveis, os FC-based SANs podem ser configurados para
satisfazer qualquer tipo de necessidade.
Servidores heterogéneos:
o Servidores UNIX,
simultaneamente.
NT
e
NetWare
podem
ser
ligados
Reduzir o Total-Cost-of-Ownership (TCO):
o A partilha das tapes libraries aumenta a eficiência.
o A gestão centralizada reduz os custos de administração.
Concluindo este capítulo, podemos afirmar que o meio informático teve um
desenvolvimento superior ao das redes e as técnicas para backups de
segurança tiveram de ser alteradas para fazer face às novas necessidades.
Também esta tecnologia continuará a desenvolver-se à medida que novas
capacidades sejam desenvolvidas.
Projecto - Computadores e Sistemas
22
Capítulo
3
Conceitos e
Fundamentos
Conceitos e Fundamentos
3.1
Backup e Arquivo
Desde um simples PC aos grandes sistemas ou redes globais, um sistema
eficaz de backup e arquivo é o principal seguro contra situações que quase
sempre caem no esquecimento - falhas de hardware, erros de software,
erro humano, desastres naturais, intrusão ou até roubo.
Existe porém uma diferença entre backup e arquivo. Backup é a protecção
dinâmica dos sistemas, onde a informação em backup é regularmente
actualizada segundo estratégias bem definidas que incluem, normalmente,
backups incrementais, diferencias e totais. Arquivo é simplesmente uma
cópia total que é guardada num determinado suporte e aí permanece
estática durante algum tempo.
3.2
Compromissos de um sistema de backup
A implementação de uma solução de backup tem a mesma lógica da
adjudicação de um contrato de seguros. Fazêmo-lo na esperança de nunca
ter que recorrer aos seus serviços.
Os gestores de informação e de sistemas que remetem para último plano a
planificação atempada de métodos e estratégias de backup, certamente
que o fazem não por leviandade mas por mera inconsciência.
Outros, exagerando na precaução, investem em sistemas de grande
disponibilidade com o objectivo de poupar o tempo que leva a concluir um
backup. De notar, porém, que de nada serve o investimento se os serviços
de recuperação continuarem a ser morosos e a inspirar pouca confiança.
De escalabilidade versátil, uma solução de backup deverá ser dimensionada
à medida da previsão de crescimento dos sistemas e do ambiente
envolvente que, normalmente, é multiplataforma. A arquitectura,
estratégias, tecnologias e métodos de backup, deverão optimizar as
facilidades do sistema numa solução de compromisso entre vários pontos:
Projecto - Computadores e Sistemas
24
Conceitos e Fundamentos
•
Janela de backup
É bastante frequente ouvir-se falar de backup window. Esta
expressão caracteriza o tempo que demora a completar-se uma
operação de backup, sendo um factor de avaliação da sua
prestação. Pela parte do sistema protegido, a janela temporal
dedicada ao backup é definida pelo tempo que um sistema fica
dedicado exclusivamente à operação de backup, situação em que é
exigida a paragem total ou parcial dos seus serviços.
•
Recuperação de ficheiros
Esta operação é normalmente conhecida pela designação restore, e
refere-se ao serviço primário de um sistema de backup - repor
ficheiros ou versões antigas que eventualmente tenham sido
corrompidas ou apagadas por engano. Esta operação é possível
desde que o problema que deu origem à corrupção de ficheiros não
tenha abalado a integridade do sistema operativo (S0) do sistema
protegido, até ao ponto de não ser possível a transferência de
ficheiros.
•
Recuperação de sistema
Existem por vezes situações em que o sistema operativo foi de tal
modo corrompido que já não é possível suportar os serviços de
restore disponibilizados pelo sistema de backup. Nessa altura torna-se prioritário a recuperação total do sistema, que poderá ser feita
recorrendo aos serviços de DR, que também devem fazer parte
integrante do sistema de backup.
3.3
Estratégias de backup
Na implementação de uma solução de backup, não basta garantir a sua
eficiência. A escolha e o ajustamento das estratégias de backup são
fundamentais na obtenção de um sistema eficaz. O delineamento de
estratégias implica reflectir seriamente em algumas questões:
Qual é a informação que realmente necessita de protecção? Informação
Crítica
Qual a periodicidade que devem ter as operações de backup? Periodicidade
Projecto - Computadores e Sistemas
25
Conceitos e Fundamentos
Quanto tempo deve residir a informação em backup? – Prazo de
validade
3.3.1
A informação crítica
Por vezes, os recursos de armazenamento guardam informação de pouco
interesse, quando encarada sob o ponto de vista da sua integridade e
necessidade de protecção. Em alguns casos, uma percentagem não
desprezável da informação distribuída nos sistemas permanece imutável,
com baixa taxa de consulta e bastante desactualizada. Também é
frequente verificar-se a acumulação de múltiplas cópias do mesmo ficheiro.
A informação estática ou “morta” deverá, sempre que possível, ser
endereçada para um sistema de arquivo, e não para um sistema de
backup, que deve preocupar-se apenas com a informação dinâmica.
A classificação da informação não segue sempre os mesmos padrões mas a
optimização da quantidade de tempo para a operação de backup, volume
de dados a armazenar, congestionamento da rede, etc., passa pela escolha
criteriosa do que deve ser protegido.
3.3.2
Periodicidade das operações de backup
A periodicidade das operações de backup está intimamente ligada com a
taxa de crescimento da informação e com o esforço que é necessário
despender para repor a informação, desde a última operação de backup.
Em alguns ambientes, um backup semanal poderá ser suficiente,
nomeadamente quando a informação criada durante uma semana pode ser
readquirida ou recriada sem grandes custos. O mesmo já não se aplica em
sistemas de aquisição em tempo real, instituições financeiras,
processamentos de dados correspondentes a eventos únicos, processos de
aquisição de grandes volumes de dados, em que o custo dessa aquisição é
mais significativo do que a facilidade de reposição do processo.
Seria então de aconselhar uma estratégia baseada unicamente em backups
diários totais? De modo algum. Uma estratégia eficaz deve envolver
também backups diferenciais ou incrementais, que exigem menos espaço
de armazenamento e reduzem substancialmente a janela de backup.
Projecto - Computadores e Sistemas
26
Conceitos e Fundamentos
Tipo de ficheiro
Fazer o backup Fazer o backup
diariamente
semanalmente
Ficheiros de dados
Ficheiros
importantes
(pode ser feito o backup
várias vezes por dia)
Outros ficheiros (inclui
ficheiros de sistema e
ficheiros de software)
X
X
X
X
X
Tabela 1 – Periodicidade dos backups.
3.3.3
Prazo de validade da informação em backup
O tempo durante o qual se pode guardar um backup está condicionado
pela capacidade de armazenamento atribuída ao sistema de backup. Numa
situação ideal seria praticável guardar todo o histórico por um período
infinito. A operação de reposição de um ficheiro é normalmente a
consequência de um pedido de um utilizador que se recorda que, afinal, a
versão do mês passado ainda continha informação que agora é critica.
Infelizmente, há que considerar que a capacidade de armazenamento online dum sistema de backup não é infinita.
Assim sendo, há que definir um prazo de validade e dá-lo a conhecer a
todos os utilizadores do sistema.
3.4
Quando é que os backups devem ser feitos
Idealmente, devia fazer-se o backup de dados após determinadas horas,
quando o número de postos na rede fosse mínimo. Esta estrutura temporal
após o horário laboral é denominada janela de backup. Muitas empresas
pequenas têm uma janela de backup adequada para realizar os trabalhos
de backup à noite e nos fins-de-semana.
Contudo, se a empresa funcionar 24 horas por dia, 7 dias por semana
(24x7), ou se houver funcionários a laborar em zonas com horário
diferente, pode ter-se uma pequena janela de backup ou não se ter mesmo
Projecto - Computadores e Sistemas
27
Conceitos e Fundamentos
nenhuma. Neste caso, seria necessário determinar um período de tempo
que afectasse o menos possível os empregados.
Caso a empresa labore 24x7, poder-se-ia utilizar software de backup que
possuísse uma opção de ficheiro aberto. Esta opção permite realizar um
backup mesmo que os ficheiros estejam a ser utilizados.
3.5
Tipos de backup
As aplicações de software incluem opções para copiar o conjunto completo
de ficheiros de sistema, para proceder à cópia de um conjunto parcial de
ficheiros novos ou modificados e ainda para copiar ficheiros individuais
seleccionados.
A maior parte das empresas utiliza uma combinação de backups parciais e
completos efectuando backups nocturnos em ficheiros que tenham sido
alterados durante o dia e backups completos de todos os ficheiros num dia
do fim-de-semana.
3.5.1
Backups Completos
Um backup completo copia todos os ficheiros existentes no sistema – os
ficheiros de sistema, os ficheiros de software e os ficheiros de dados. O
backup completo deve ser feito semanal, quinzenal ou mensalmente. Com
um backup completo dos dados agrupados numa tape, será possível
recuperar o sistema inteiro se algum imprevisto destruir os ficheiros
originais. Se o conjunto de dados for reduzido, poder-se-á realizar um
backup completo diariamente. Contudo, não se deve utilizar a mesma tape
todos os dias, o que poderia levar à sua danificação após um determinado
período de tempo.
3.5.2
Backups Parciais
Um backup parcial copia todos os ficheiros que tenham sido adicionados ou
modificados desde o último trabalho de backup. Há dois tipos principais de
backups parciais - incremental e diferencial, sumariados na tabela seguinte.
Projecto - Computadores e Sistemas
28
Conceitos e Fundamentos
Tipo de
backup
Incremental
Diferencial
Ficheiros copiados
Ficheiros adicionados ou alterados desde o
último backup completo ou parcial.
Ficheiros adicionados ou alterados desde o
último backup completo.
Tabela 2 – Tipos de backups parciais.
Para certos ficheiros cruciais, difíceis de recriar, poder-se-á realizar um
backup selectivo, em qualquer altura, durante o dia. Com este método, não
é necessário esperar até ao próximo backup para copiar os ficheiros
cruciais.
3.5.3
Backups Incrementais
Caso seja necessário economizar tempo e custos durante os trabalhos
regulares de backup, pode seleccionar-se um plano que inclua backups
completos e incrementais. Com esta estratégia, procede-se a um backup
regular de todos os ficheiros (semanal, quinzenal, etc.), e a um backup
mais frequente (diário) apenas dos ficheiros que foram alterados desde a
última sessão de backup.
Este método de backup completo/incremental significa que é necessário
copiar um número mais reduzido de ficheiros e que é necessário menos
tempo para o procedimento de backup. No entanto, este método também
permite fazer restaurar completamente o sistema mais lentamente se se
tiver criado várias tapes de backup incremental (uma para cada dia da
semana, por exemplo), ou se for necessário restaurar apenas um certo
ficheiro e montar várias tapes de backup incremental.
Visto que uma sessão de backup incremental pode utilizar apenas uma
pequena parte da tape, pode conservar-se o número necessário de tapes
de backup, utilizando-se a opção software’s tape-append. Esta opção
permite escrever sessões adicionais de backup onde terminou a sessão
anterior e fazer uso total de uma única tape. Contudo, caso se perca esta
tape, perdem-se os dados de várias sessões de backup.
Projecto - Computadores e Sistemas
29
Conceitos e Fundamentos
3.5.4
Backups Diferenciais
Se for necessário maior protecção no restore em caso de falha, deve
escolher-se um plano que inclua backups completos e diferenciais. Com
esta estratégia, efectua-se um backup regular de todos os ficheiros
(semanal, quinzenalmente, etc.) ou um backup mais frequente
(diariamente) de todos os ficheiros que foram alterados desde a última
sessão de backup completo.
O backup diferencial é substancialmente mais rápido que o total. Porém, à
medida que o número de operações de backup aumenta, o volume de
dados a gravar também aumenta. Nas vésperas de um novo backup total,
o volume de dados a gravar no modo diferencial pode ser quase tão
grande como no total. Sempre que se escolher este modelo deverá medir-se bem a janela de tempo disponível e compatibilizá-la com o volume de
dados previsto.
Como se infere, a reposição de ficheiros através do método diferencial, é
muito mais rápida do que a utilização do método incremental - no caso do
diferencial há que recorrer apenas ao último total e ao último diferencial,
enquanto nos incrementais tem que se recorrer não apenas ao último total
mas a todos os incrementais.
A escolha entre backup incremental ou diferencial está relacionada com o
volume de dados que diariamente é acrescentado, o que condiciona a
dimensão do sistema de armazenamento, o seu débito (MB/s) e o tempo
disponível para a operação.
3.6
Qual é a melhor estratégia de backup
Será preferível combinar backups completos com backups diferenciais ou
incrementais? A resposta a esta questão depende da situação e dos
factores mais importantes a ter em conta. Se se quiser poupar tempo e
custos no processo de backup, deve escolher-se backups incrementais
parciais. Se for mais importante proceder a um processo de reparação o
mais simples e rapidamente possível em caso de acidente, deve escolherse backups diferenciais parciais.
Grande parte das empresas realiza backups completos/parciais, visto que o
processo de reparação apenas requer duas tapes.
A tabela seguinte realça as principais vantagens e desvantagens das
estratégias de backup incremental e diferencial.
Projecto - Computadores e Sistemas
30
Conceitos e Fundamentos
Tipo de backup Vantagens
Incremental
(todos os
ficheiros novos
ou alterados
desde o último
backup completo
ou parcial)
Diferencial
(todos os
ficheiros novos
ou alterados
desde o último
backup
completo)
Desvantagens
- Reparação mais
lenta porque pode ser
necessário mais de
duas tapes (a tape de
- Desgaste reduzido backup completo e
no equipamento
cada uma das tapes
de backup e na
de backup
tape.
incremental).
- Backup mais
rápido porque há
menos ficheiros.
- São necessárias
menos tapes.
- Aumento dos custos
de downtime em caso
de quebra no sistema.
- Reparação mais
rápida porque só
são
necessários
dois conjuntos de
tapes (as tapes de
backup completo e
de
backup
diferencial).
- Processo de backup
mais lento, porque
são copiados mais
ficheiros.
- Custos reduzidos
de downtime em
caso de quebra no
sistema.
- Aumento de
desgaste no
equipamento de
backup e na tape.
- Podem ser
necessárias mais
tapes.
Tabela 3 – Principais vantagens e desvantagens de backup incremental e diferencial.
3.7
Onde é que os backups devem ser guardados
Deve ser guardada uma cópia completa dos dados da empresa on-site para
uma recuperação imediata e outra cópia off-site, num local seguro, para a
eventualidade de a empresa sofrer um incêndio, um assalto ou qualquer
outra ocorrência danosa. Muitas empresas pequenas guardam as tapes de
backup num banco local ou em casa do proprietário. Para eliminar a
preocupação, há outras empresas que preferem fazer um contrato com
firmas especializadas em arquivo e armazenamento.
Projecto - Computadores e Sistemas
31
Conceitos e Fundamentos
3.8
Porque é que a tape é ideal para fazer o backup
Quer se faça o backup de uma workstation individual ou de uma pequena
rede, a tape é um meio ideal de armazenamento porque permite
armazenar grandes quantidades de informação a um preço relativamente
baixo. Além disso, a tape é um meio perfeito para fazer o arquivo porque
permite o armazenamento de tape off-site para aumentar a segurança dos
dados.
3.9
Determinar o número necessário de tapes
Para determinar quantas tapes são precisas, é necessário considerar o
seguinte:
Tamanho completo do backup. Convém saber qual é o tamanho, em
gigabytes, de um sistema completo de backup. Esta quantidade deverá
incluir os ficheiros de dados, os ficheiros de sistema e os ficheiros de
software. Uma vez determinada a capacidade total, deve dividir-se esse
número pela capacidade total de cada tape. Por exemplo, se a capacidade
total do sistema for 600 gigabytes e a de cada tape for 60 gigabytes, serão
necessárias 10 tapes.
Grande parte das drives de tape e das aplicações de software permitem
fazer uma compressão dos dados de forma a reduzir o tamanho dos
ficheiros. Ao comprimir os dados, a quantidade de tapes necessárias será
reduzida.
Tamanho parcial do backup. Deve estimar-se o tamanho, em gigabytes
de um backup parcial (diferencial ou incremental). Esta quantidade inclui
os ficheiros de dados que são alterados diariamente. Por exemplo, se a
média de um backup incremental for 60 gigabytes e a de cada tape for 30
gigabytes, serão necessárias 2 tapes para cada backup incremental.
Método de rotação de tapes e frequência de backups. Impõe-se
saber qual é o método de rotação que se irá implementar e quantas tapes
serão necessárias. Por exemplo, num esquema de rotação GrandFatherFather-Son, será necessária uma tape para quatro backups parciais por
semana (1x4=4 tapes), três tapes para quatro backups completos por
semana (3x4=12 tapes) e três tapes para doze backups mensais completos
(3x12=36 tapes). Serão necessárias 52 tapes (4+12+36).
Projecto - Computadores e Sistemas
32
Conceitos e Fundamentos
Arquivo de tapes. Para se saber quantas tapes serão arquivadas off-site
anualmente, deve ter-se em conta se o arquivo do backup completo será
feiro mensalmente ou trimestralmente. Por exemplo, se um backup
completo necessitar de 3 tapes e se planear arquivar uma cópia de um
backup completo por mês, serão necessárias 36 tapes por ano.
Retirada das Tapes. A retirada de circulação das tapes utilizadas para
backups diários deve ser determinada de acordo com a frequência de
utilização das tapes.
Se o software der conta de erros de reescrita pode querer-se monitorizar
esse número e descartar qualquer tape que mostre um aumento
significativo nos erros. O custo de substituição de uma tape é muito menor
do que o custo de perda dos dados.
3.10 Determinar o custo
Pode comprar-se tapes com diferentes durações que oferecem várias
capacidades de armazenamento de dados. Os preços podem variar
bastante por tape, dependendo do tipo de drive de tape que se possui.
Também será necessário adquirir algumas tapes de limpeza para assegurar
uma operação adequada.
3.11 Com que frequência as tapes devem ser substituídas
Deve seguir-se as instruções do fabricante para o armazenamento e
substituição das tapes. A maior parte dos fabricantes coloca as instruções
na embalagem da tape. Há também certos softwares de backup que
indicam erro na tape, o que alerta para o facto de a tape dever ser
substituída. No entanto, regra geral, as tapes utilizadas para fazer backups
diários devem ser substituídas uma vez por ano.
Projecto - Computadores e Sistemas
33
Conceitos e Fundamentos
3.12 Tapes e tempo necessários para um backup
Os exemplos seguintes demonstram a forma como uma estratégia de
backup diferencial ou um backup incremental afectam as tapes e o tempo
necessários para fazer um backup.
Backup diferencial: tapes e tempo necessários*
Dia
Tipo
Sexta-feira
Segunda-feira
Terça-feira
Quarta-feira
Quinta-feira
Total:
Completo
Diferencial
Diferencial
Diferencial
Diferencial
Tamanho
160 GB
45 GB
56 GB
67 GB
83 GB
411 GB
Tempo
4 horas
1.1 horas
1.4 horas
1.7 horas
2.1 horas
10.3
horas
Nº de
tapes
3 tapes
1 tape
1 tape
2 tapes
2 tapes
9 tapes
Tabela 4 –Backup diferencial: tapes e tempo necessários.
Backup incremental: tapes e tempo necessários*
Dia
Tipo
Sexta-feira
Segunda-feira
Terça-feira
Quarta-feira
Quinta-feira
Total:
Completo
Diferencial
Diferencial
Diferencial
Diferencial
Tamanho
160 GB
45 GB
11 GB
11 GB
16 GB
243 GB
Tempo
4 horas
1.1 horas
0.3 horas
0.3 horas
0.4 horas
6.1 horas
Nº de
tapes
3 tapes
1 tape
1 tape
1 tapes
1 tapes
7 tapes
Tabela 5 –Backup incremental: tapes e tempo necessários.
* Estes exemplos baseiam-se num ciclo de backup semanal com uma drive
de tape capaz de transferir dados a 40 gigabytes (GB) por hora para uma
tape com 60 gigabytes de capacidade.
Em backups diferenciais, a quantidade de dados e horas aumenta ao longo
da semana, necessitando de mais duas tapes e quase do dobro do tempo
de backup do que o backup incremental.
Projecto - Computadores e Sistemas
34
Conceitos e Fundamentos
3.13 Tapes necessárias para o processo de restore
Os exemplos seguintes demonstram a forma como uma estratégia de
backup diferencial ou backup incremental afectam a quantidade de tapes
necessárias para um processo de restore.
Backup diferencial: tapes necessárias para o processo de
restore
Dia
Tipo de backup
Sexta-feira
Completo
Segunda-feira
Diferencial
Terça-feira
Diferencial
Quarta-feira
Diferencial
Quinta-feira
Diferencial
Tapes necessárias para um restore
completo do sistema
Tipo de ficheiros copiados
Tape 1, 2, 3
Tape 4
Tape 5
Tape 6
Tape 7
Todas as 7 tapes
Tabela 6 –Backup diferencial: tapes necessárias para o restore.
Backup incremental: tapes necessárias para o processo de
restore
Dia
Tipo de backup
Sexta-feira
Completo
Segunda-feira
Diferencial
Terça-feira
Diferencial
Quarta-feira
Diferencial
Quinta-feira
Diferencial
Tapes necessárias para um restore
completo do sistema
Tipo de ficheiros copiados
Tape 1, 2, 3
Tape 4
Tape 5
Tape 6, 7
Tape 8, 9
Tapes 1, 2, 3, 8, 9
Tabela 7 –Backup incremental: tapes necessárias para o restore.
Num restore completo do sistema, a estratégia de backup diferencial
requer apenas um backup completo em tape à sexta-feira e um backup
diferencial, também em tape, à quinta-feira, enquanto a estratégia de
backup incremental requer todas as tapes de backup.
Projecto - Computadores e Sistemas
35
Conceitos e Fundamentos
3.14 Esquemas de rotação de tapes
Na maioria das situações, os periféricos de armazenamento dedicados aos
sistemas de backup utilizam bobines de fita magnética.
As tecnologias de gravação mais utilizadas deram origem a vários modelos,
dos quais se destacam as AIT, DLT, VXA, LTO, Magstar.
3.14.1
Media Sets
Num esquema rotação de tapes, é normal que, devido à quantidade de
armazenamento requerida, uma tape não seja suficiente para uma
determinada operação de backup. Nessa altura, são constituídos grupos de
tapes, conhecidos por Media Sets.
Existem vários métodos de rotação. Qualquer deles procura minimizar o
número de tapes envolvidas, em compromisso com a máxima variedade
histórica das versões disponíveis e a periodicidade dos backups. Um bom
esquema de rotação deve garantir, ainda, que a distribuição da informação
em backup permita a recuperação eficaz de ficheiros e de sistemas.
Uma grande parte das empresas utiliza um dos seguintes tipos de rotação,
descritos mais detalhadamente nas páginas seguintes:
o Six-Tape;
o Grandfather – Father – Son;
o Torres de Hanoi;
Nota: Estas sugestões para implementar as estratégias de rotação podem
ser modificadas de várias formas, de acordo com as necessidades.
3.14.2
Rotação Six-Tape
O método de rotação Six-Tape é um esquema simples e com custos
efectivos para um esquema de uma tape por dia, o qual é ideal para
pequenos negócios que não necessitem de fazer o backup de grandes
volumes de dados. Este método implica fazer a rotação entre duas tapes
nos backups completos às sextas-feiras, e utilizar quatro tapes para cada
um dos backups, incremental ou diferencial, de segunda a quinta-feira.
Projecto - Computadores e Sistemas
36
Conceitos e Fundamentos
Se a total capacidade dos dados não couber na tape, deve utilizar-se
conjuntos de tapes. A maior parte dos softwares fornece opções para gerir
os conjuntos de tapes.
Para realizar um método de rotação Six-Tape:
1. Deve comprar-se seis tapes e etiquetá-las:
Tape 1: SEX1
Tape 2: SEX2
Tape 3: SEG
Tape 4: TER
Tape 5: QUA
Tape 6: QUI
2. Começando numa sexta-feira, deve realizar-se um backup completo na
tape SEX1 e guardar a tape off-site. Para uma protecção ainda maior, deve
fazer-se um duplicado da tape SEX1: uma para se guardar on-site e outra
para se guardar off-site.
3. Às segundas, terças, quartas e quintas-feiras, deve realizar-se um
backup incremental ou diferencial numa tape apropriadamente
etiquetada. Deve guardar-se estas tapes na empresa.
4. Na sexta-feira seguinte, deve realizar-se um backup completo na tape
SEX2, que deve ser guardada off-site; se se quiser, pode recuperar-se a
tape SEX1 para o backup completo a fazer na próxima sexta-feira.
5. Repetir o passo 3, reutilizando as tapes de segunda até quinta-feira.
6. Às sextas-feiras, deve fazer-se backups completos, alternando
entre as tapes SEX1 e SEX2, assegurando que se guarda pelo menos
uma tape de sexta-feira off-site.
O gráfico seguinte demonstra como se pode criar um esquema de rotação
Six-Tape num mês.
Projecto - Computadores e Sistemas
37
Conceitos e Fundamentos
Segunda Terça
Quarta
Quinta
Sexta
SEX1
SEG
TER
QUA
QUI
SEX2
SEG
TER
QUA
QUI
SEX1
SEG
TER
QUA
QUI
SEX2
SEG
TER
QUA
QUI
SEX1
Incremental ou Diferencial
Completo
Tabela 8 - Método de rotação Six-Tape num período de um mês.
Para um esquema de backup ainda mais eficiente e com custos efectivos, é
possível realizar uma rotação Three-Tape. Em primeiro lugar, é necessário
realizar um backup completo na tape 1 e depois alternar entre a tape 2 e a
tape 3 para backups nocturnos e diferenciais. Pode fazer-se backups
completos de 2 em 2 semanas, ou sempre que se achar necessário. Este
método de rotação Three-Tape é ideal para quando se tem de fazer um
backup de uma pequena quantidade de dados e se quer gastar o mínimo
dinheiro possível. Para se fazer backups diferenciais apenas são
necessárias duas tapes para se fazer um restore completo do sistema.
3.14.3
Grandfather – Father– Son
O método utilizado de rotação de tapes mais comum é o GFS. Este
esquema de rotação opera segundo o mesmo princípio de cinco dias por
Tape, excepto quando se
semana, utilizado no método de rotação Sixutilizam mais tapes para se fazer o backup de dados diariamente (nas
tapes Son), semanalmente (nas tapes Father), e mensalmente (nas tapes
Grandfather).
As tapes mensais podem ser arquivadas para
armazenamento permanente ou serem recicladas numa base trimestral ou
anual.
Projecto - Computadores e Sistemas
38
Conceitos e Fundamentos
Os passos seguintes mostram como se pode proceder a um método de
rotação simples GFS, utilizando 20 tapes:
1. Deve obter-se 20 tapes e etiquetá-las da seguinte forma:
o 4 tapes diárias (sons) etiquetadas de “SEG” até “QUI”;
o 4 tapes semanais (fathers) etiquetadas “SEMANA1” até “SEMANA4”;
o 12 tapes mensais (grandfathers) etiquetadas com o mês e o ano;
Se um backup completo exceder a capacidade de uma tape, deve criar-se
conjuntos de tapes.
2. Começando numa sexta-feira, deve realizar-se um backup completo na
tape SEMANA1 e guardar as tapes SEMANA tanto on-site como
off-site.
3. Começando na segunda-feira seguinte, deve fazer-se backups
diferenciais ou incrementais diários nas tapes de SEG até QUI que
devem ser guardadas on-site.
4. Às sextas-feiras, deve fazer-se outro backup completo na tape
SEMANA2.
5. Continuar com este método de rotação até ao último dia útil do mês.
Neste dia (não importando em que dia da semana calha), deve realizar-se
um backup completo na tape do primeiro mês (Grandfather). Deve
etiquetar-se a tape com a data actual e guardá-la off-site.
O esquema seguinte demonstra como se pode criar um esquema de
rotação GFS.
Segunda
Terça
Quarta
Quinta
Sexta
SEMANA 1
SEG
TER
QUA
QUI
SEMANA 2
SEG
TER
QUA
QUI
SEMANA 3
SEG
TER
QUA
QUI
SEMANA 4
SEG
TER
QUA
QUI
MÊS 1
Incremental ou Diferencial
Completo
Tabela 9 - Método de rotação GFS num período de um mês.
Projecto - Computadores e Sistemas
39
Conceitos e Fundamentos
3.14.4
Torres de HANOI
O esquema Torres de Hanoi é um método seguro e com custos efectivos
de rotação de tapes, sendo também, no entanto, algo complexo. Nas
Torres de Hanoi realiza-se um backup completo em cinco conjuntos de
tapes: etiquetadas A, B, C, D, E. O conjunto de tapes A é usado em todas
as outras sessões de backup; o conjunto de tapes B é usado em cada
quatro sessões de backup; O conjunto de tapes C é usado em cada 8
sessões, e assim sucessivamente. Pode realizar-se estas sessões de backup
à noite, semanalmente ou sempre que se julgue necessário.
A tabela seguinte demonstra de que forma o método de rotação Torres de
Hanoi se alterna de acordo com cada conjunto de tapes:
Sessão de
backup
Tape a usar
1
2
A
B
3
4
5
A
C
A
6
7
B
A
8
9
D
A
10
B
11
12
A
C
13
14
A
B
15
16
A
E
Tabela 10 – Rotação de tapes pelo método de Torres de Hanoi.
Projecto - Computadores e Sistemas
40
Conceitos e Fundamentos
Para realizar uma rotação de tapes Torres de Hanoi:
1. Etiquetar cinco tapes (ou conjuntos de tapes): A, B, C, D, E.
2. Para a primeira sessão de backup, fazer um backup completo na Tape
A.
3. Para a segunda sessão de backup, fazer um backup completo na Tape
B.
4. Continuar a alternar as tapes, conforme demonstrado na tabela anterior.
5. Quando se tiver chegado à tape E, no décimo sexto dia, deve começar-se novamente a configuração e guardar-se a tape E off-site.
O gráfico seguinte mostra um mês de backups no esquema de rotação
Torres de Hanoi.
Segunda
Terça
Quarta
Quinta
Sexta
Tape
Tape
Tape
Tape
Tape
A
B
A
C
A
Tape
Tape
Tape
Tape
Tape
B
A
D
A
B
Tape
Tape
Tape
Tape
Tape
A
C
A
B
A
Tape
Tape
Tape
Tape
Tape
E
A
B
A
C
Tape
Tape
Tape
A
B
A
|____________ Completo ______________|
Tabela 11 - Método Torres de Hanoi num período de um mês.
Projecto - Computadores e Sistemas
41
Conceitos e Fundamentos
3.14.5
Qual é o melhor método de rotação
Método
de rotação
Six-tape
Vantagens
Desvantagens
Necessita
de
apenas
algumas tapes, o que
permite um método de
rotação fácil e barato. É
ideal
para
pequenas
quantidades de dados.
Apenas guarda os dados
importantes de uma
semana, a menos que
se faça regularmente o
arquivo das tapes de
backup completo.
Grandfather –
Oferece a protecção mais Requer mais tapes, o
Father – Son (GFS) segura dos dados e que
pode
tornar-se
implementa
arquivos dispendioso.
mensais
de
tapes.
Também é um método
simples, suportado pela
maior
parte
dos
softwares.
Torres de Hanoi
Permite restores simples
em full-system. È ideal
para pequenos negócios
que estejam interessados
na
capacidade
de
fazerem
restores
completos. Também tem
custos mais efectivos do
que o GFS (utiliza menos
tapes).
Requer uma estratégia
de rotação difícil que
não é tão fácil de
implementar como os
outros métodos. A não
ser que o software de
backup
o
possa
suportar, este método é
demasiado
complexo
para se trocar as tapes
manualmente. Também
requer
consumo de
tempo em cada sessão
de backup completo.
Tabela 12 – Comparação dos métodos de rotação.
Projecto - Computadores e Sistemas
42
Conceitos e Fundamentos
3.15 O File-by-File e o Image Backup
O Image e o File-by-file são as metodologias de backup mais comuns.
Num backup do tipo file-by-file a informação é copiada ficheiro a ficheiro.
Neste caso, o sistema de backup vai pedindo ao sistema que protege, a
cópia de cada ficheiro. Assim, o sistema protegido é obrigado a dispensar
alguma atenção ao sistema de backup na gerência dos pedidos de I/O,
ocupando, por isso, uma percentagem significativa de recursos e de
reserva de processamento.
Devido à fragmentação, a informação relativa a um ficheiro não se
encontra, normalmente, armazenada em regiões adjacentes do suporte
físico de armazenamento. Por este facto, a ordem lógica de um ficheiro
raramente corresponde a uma ordem de posição física sequencial, e
durante a cópia de um ficheiro, as cabeças de leitura de cada disco duro
são constantemente movidas entre regiões espaciais distantes, executando
movimentos descontínuos e bruscos. A esta perda de eficácia no processo
de leitura, corresponde um fluxo de informação intermitente. Explica-se,
assim, que as taxas transferência reais muito raramente se aproximam dos
débitos disponibilizadas pelos periféricos de armazenamento dedicados ao
backup. A performance do sistema de backup pode ser substancialmente
melhorada, desfragmentando o disco regularmente.
O image backup cria uma copia física exacta do suporte onde reside a
informação, que é normalmente o disco, do sistema que se pretende
proteger. A ordem sequencial de transferência da informação não segue os
sistemas de directórios com que se organiza um volume lógico. Em vez
disso, o image backup opera ao nível físico do disco, transferindo os
blocos, segmento a segmento, cilindro após cilindro. As cabeças de leitura
percorrem o disco num movimento contínuo, fornecendo um fluxo de
informação constante que maximiza a taxa de transferência para o suporte
de armazenamento de backup.
O image backup é particularmente útil quando se pretende fazer a
recuperação de todo um disco. Numa situação de DR, toda a informação
será reposta em disco seguindo a ordem sequencial física de bloco em
bloco igual à sequência da imagem residente em backup. Assim, mesmo
que o acesso ao periférico de armazenamento de backup seja sequencial, a
taxa de transferência é maximizada, proporcionando uma rápida
recuperação do sistema.
Durante uma operação de backup, o local onde reside lógica e fisicamente
a informação protegida, não pode ser modificado. De modo a garantir a
Projecto - Computadores e Sistemas
43
Conceitos e Fundamentos
consistência da informação em backup, a maioria dos sistemas do tipo
image backup requerem que o sistema a proteger esteja off-line.
Qualquer das técnicas tem vantagens e inconvenientes. Vejamos em que
situações:
o Backing up. Os frequentes pedidos de I/O e o reposicionamento
constante das agulhas do disco do sistema protegido fazem com que
tradicional sejam
as tecnologias baseadas no file-by-file
consideravelmente mais lentas do que as do tipo image backup.
Neste último, todos os blocos de um disco são copiados,
inclusivamente aqueles que não contêm informação. Desperdiça-se
assim, alguma capacidade de armazenamento dedicada ao backup.
o Restoring. A recuperação de ficheiros a partir das cópias
fragmentadas, residentes num image backup, é mais lenta do que a
partir de um file-by-file backup. Esta baixa prestação é muito mais
evidente quando o suporte dedicado ao backup é do tipo sequencial
- fita magnética.
o Disaster Recovery. O image backup está fortemente ligado à
geometria do disco que se protege. Uma imagem só pode ser
reposta para um disco que tenha exactamente a mesma organização
física de blocos, segmentos, pistas e cilindros, i.e., a informação só
pode ser reposta para um disco igual àquele que foi a fonte do
image backup. Com o file-by-file backup também é possível
recuperar todo o sistema. Esta operação é mais complicada e mais
lenta do que no caso da recuperação a partir de uma imagem. Por
outro lado, não é necessário que o disco do sistema a recuperar seja
idêntico ao disco fonte.
3.16 Novas tecnologias de Backup
Existem no mercado vários tipos de software que permitem reduzir ao
mínimo a intervenção humana na gestão dos sistemas, bem como
contornar as principais dificuldades impostas pelos métodos de backup
tradicionais. Nomeadamente, implementam a gestão automática de media
sets em libraries robotizadas, possibilitam a criação de uma imagem a
partir de um backup do tipo file-by-file, automatizam as operações de DR,
Projecto - Computadores e Sistemas
44
Conceitos e Fundamentos
e utilizam métodos que asseguram a consistência da informação mesmo
quando a operação de backup é realizada com os sistemas on-line.
Contornando as desvantagens e agregando as virtudes dos sistemas de
backup tradicionais, surgem, então, novas formas de abordar o problema
da segurança da informação distribuída em redes.
3.16.1
Real-Time backup
Sendo uma variante do file-by-file backup, nesta tecnologia de backup, as
actualizações da informação em backup são feitas sempre que é adicionada
informação ao sistema protegido, eliminando-se a necessidade da janela de
backup.
3.16.2
Object Replication
Esta tecnologia baseia-se no image backup mas permite uma recuperação
do tipo file-by-file. Com efeito, no image backup a estrutura da árvore não
é gravada, o que obriga a uma recuperação fisicamente igual. O Object
Replication memoriza essa estrutura em base de dados, permitindo que, na
fase de recuperação, os ficheiros sejam recuperados desfragmentados e
seguindo a árvore de directórios do volume, conjuntamente com as
propriedades de segurança de cada ficheiro.
Nas redes informáticas das Empresas e Organizações existem muitos
ficheiros e partes de ficheiros comuns a um grande conjunto de clientes.
Além dos ficheiro do sistema operativo e aplicações, são também exemplo
de redundância os formulários, logos, os templates de cartas, de faxes, de
facturas, de pedidos de pagamento, envios de pagamento e muitos outros
específicos da actividade das empresas. Alguns softwares de backup,
dedicados a garantir a segurança das estações de trabalho, aplicam novas
tecnologias baseadas em novos princípios, de que são exemplo o
Redundant File Elimination (RFE) e o Redundant Block Elimination (RBE).
Seguindo esta tecnologia, na operação de backup total ao primeiro cliente
é copiada a totalidade dos blocos. Ao segundo cliente, porém, já não serão
incluídos os blocos que são redundantes relativamente ao primeiro. Na
operação de backup ao N-éximo cliente já não serão incluídos os ficheiro e
blocos que são redundantes relativamente ao primeiros N-1 clientes.
Em ambientes em que os sistemas operativos alternam entre Win98/95 e
estações de trabalho NT, suportando as aplicações habituais do pacote
Office, será de esperar que depois de concluídos os backups semente
Projecto - Computadores e Sistemas
45
Conceitos e Fundamentos
(primeiros clientes) se verifique uma redução drástica nos tempos
estimados para os backups aos clientes seguintes.
Na grande maioria dos documentos das empresas e organizações, são
ainda comuns expressões como “Exmos Srs”, “Melhores cumprimentos”,
“Atentamente”, etc. Os softwares de backup de última geração integram
algoritmos de compressão capazes de gerarem a codificação de termos
redundantes, estendendo a política de eliminação de informação
redundante ao nível da palavra.
Por outro lado, um cliente só é sujeito a uma operação total da primeira
vez que esta se efectua. Com efeito, depois de concluído o backup
semente todos os seguintes são “backups incrementais” pois só são
copiados os blocos de memória em disco que mudaram relativamente ao
backup anterior.
Numa segunda fase, da responsabilidade do servidor de backup, os blocos
novos, ligados por uma base de dados aos ficheiros respectivos a que
pertencem, são acrescentados ao backup do cliente. Este tipo de backup
tem o nome de Full Virtual Backups e tem vindo a proliferar em LANs de
baixas prestações revelando resultados excelentes.
Medições efectuadas, em condições reais de ethernet a 0.6MB/s,
permitiram registar janelas de backup na ordem dos 3 minutos para
concluir um backup total a clientes, com uma média de 3GB armazenados.
Havendo necessidade de se recuperar um cliente na totalidade com base
num full virtual backup, o software gera, automaticamente, uma imagem
do disco a recuperar bem como um disco de arranque personalizado, i.e.,
dedicado a esse cliente.
O cliente a recuperar “arranca” através de um mini sistema operativo que
garante as comunicações sobre a rede com o servidor de backup onde
reside a imagem, que é restaurada automaticamente sem necessidade de
mais intervenção de um operador.
Projecto - Computadores e Sistemas
46
Capítulo
4
Planeamento de uma
estratégia de backup
Planeamento de uma estratégia de backup
Compreender toda a estrutura da empresa
Para criar uma estratégia de backup, o factor mais importante é
compreender todo ambiente onde esta será aplicada. Este capítulo
apresenta a informação a que o responsável terá de ter acesso para
implementar a estratégia mais eficiente e segura.
4.1
Volume dos dados
O primeiro passo é determinar a quantidade de dados para fazer o backup
ou arquivo regularmente. Os dois principais factores a determinar são o
tamanho total dos dados e o tamanho dos dados que sofrem alterações.
4.1.1
Tamanho total dos dados
O tamanho total dos dados existentes é uma indicação do seguinte:
o Quantidade mínima de capacidade de armazenamento necessária;
o Quantidade de dados a fazer backup durante um backup completo;
o Previsão da capacidade total necessária;
O tamanho total dos dados é frequentemente uma das peças de
informação mais fáceis de obter e tem tendência para ser especificado
como parte dos requisitos.
4.1.2
Tamanho dos dados que sofrem alterações
O tamanho dos dados que sofrem alterações determina o volume de dados
que têm de ser gravados durante os backups incrementais. À medida que o
número de ficheiros alterados aumenta, o volume de dados que necessita
Projecto - Computadores e Sistemas
48
Planeamento de uma estratégia de backup
de ser gravado para tape também aumenta. Será necessário também saber
ou estimar os seguintes factores:
A frequência de alteração dos dados - A frequência de alteração dos
dados determina a frequência com que devem ser feitos os backups. Esta
frequência pode variar. Por exemplo, algumas directorias nunca mudam,
outras mudam apenas quando é feito o upgrade de alguma coisa, outras
mudam só no fim do mês e algumas como os mails mudam tipicamente de
minuto a minuto. A frequência de alteração dos dados determina, em
parte, o volume dos dados escritos durante os backups incrementais,
porque estes apenas guardam os ficheiros que foram alterados.
Volume de dados a que se deve fazer backup - É necessário decidir
se deve fazer-se um backup a todos os dados ou apenas às partes
alteradas. Enquanto é mais rápido gravar apenas as partes alteradas é
também mais rápido fazer o restore de todos os directórios e ficheiros de
backups completos, do que de backup incrementais. Isto porque, para se
fazer um restore de um backup incremental é necessário previamente fazer
o restore de um backup completo e, depois, de todos os backups
incrementais até às últimas versões de todos os ficheiros que são para
fazer restore.
4.2
Tipo de dados
O tipo de dados aos quais deve ser feito backup limita o nível de
compressão que se pode esperar do hardware ou software de backup. Não
há garantia de que os tipos de dados que têm de ser comprimidos tenham
propriedades similares. Assim sendo, é mais seguro assumir que os dados
não serão previamente comprimidos, e comprimir todos os dados aos quais
deve ser feito o backup.
4.3
Estrutura de ficheiros
Outro factor a considerar é a estrutura de ficheiros: será feito o backup
usando o sistema de ficheiros ou em bruto.
Projecto - Computadores e Sistemas
49
Planeamento de uma estratégia de backup
Uma cópia em bruto significa copiar todos os bits do volume de dados a
fazer backup directamente para uma tape ou outro dispositivo de arquivo.
Esta forma capta todos os bits do sistema de ficheiros ou o conjunto dos
metadados dos dados, assim como os dados das aplicações escritos no
volume de dados a fazer backup. No entanto, os metadados podem estar
dessincronizados com os dados do volume a fazer backup, isto porque, os
metadados não são interpretados e assim não podem distinguir o backup
dos outros acessos aos dados. Para prevenir este problema, o backup deve
ser feito off-line ou então marcar todos os dados como read-only enquanto
dura a operação de backup.
Em contraste, num backup que usa o sistema de ficheiros, os ficheiros são
lidos pela ordem dos directórios e podem estar dispersos por varias áreas
do disco, causando atrasos na passagem de um ficheiro para o seguinte.
Para conseguir uma performance perto da do backup em bruto, pode
minimizar-se as diferenças com uma configuração cuidada. No entanto, em
certas situações, o backup em bruto é superior, mesmo que seja só pela
sua maior simplicidade.
4.4
Origem dos dados
Conhecer de onde vêm os dados ajudará a planear uma configuração
apropriada. A configuração necessária para um backup local a alta
velocidade é muito diferente da necessária para fazer backup de dezenas
de computadores dispersos pela rede. As considerações a seguir, exploram
este assunto mais em pormenor.
4.4.1
O servidor onde estão os dados é o que faz os
backups
Quando o servidor onde residem os dados é o que faz os backups, este
tem de ter capacidade de satisfazer a janela de backup e de assegurar a
capacidade de múltiplos backups de dados (diários diferenciais, semanais
incrementais, mensais completos).
Projecto - Computadores e Sistemas
50
Planeamento de uma estratégia de backup
4.4.1
Os dados estão em clientes remotos
Esta situação envolve a necessidade de planear os requisitos mínimos de
rede, de modo a satisfazer a janela de backup. Não existe nenhuma
solução tipo, devido à enorme variedade de configurações possíveis ao
nível das redes informáticas.
Para compreender toda a situação e obter uma solução satisfatória, é
necessário obter resposta sobre as seguintes questões chave:
Quantos clientes existem? Conhecer o número de clientes ajuda a
compreender a escala da empresa que se esta a tratar.
Que tipo de clientes são? Para compreendermos a capacidade de
processamento dos clientes, é preciso saber o tipo de clientes (i.e. a
arquitectura e o sistema operativo) a que é preciso fazer backup. Por
exemplo, se um cliente tem uma grande capacidade de processamento
mas a largura de banda do acesso via rede é pequena, então utilizar
software de compressão é uma boa escolha para melhorar o backup a esse
cliente.
Os clientes têm o seu próprio dispositivo de backup? Se os clientes
possuem um dispositivo de backup, a melhor configuração seria uma
hierarquia do tipo master-slave. Neste tipo de configuração o master inicia
o backup mas os dados vão para o dispositivo de backup no slave.
Como estão distribuídos os clientes? Saber a forma como estão
distribuídos os clientes na empresa ajuda a avaliar a largura de banda
entre o servidor e o cliente. Esta informação é importante para prever o
tempo e as taxas de transferência necessárias para efectuar o backup.
Qual a autonomia dos sistemas clientes? Por vezes os sistemas
clientes estão longe e ligados através de uma ligação WAN ao servidor.
Frequentemente estes sistemas não têm pessoal técnico de suporte no
local e necessitam assim de ser geridos remotamente. Mas existem sempre
algumas tarefas que são obrigatoriamente feitas manualmente, e isto pode
envolver as pessoas que estão nesses locais, obrigando a que estes
possuam alguma formação para responderem em caso de necessidade.
Projecto - Computadores e Sistemas
51
Planeamento de uma estratégia de backup
4.4.2
Qual é o subsistema de discos utilizado
É necessário saber qual o subsistema dos discos para uma boa
performance com a novas tecnologias de backup. Isto porque, o disco pode
tornar-se o bottleneck, assumindo que a largura de banda da rede é
suficiente ou os backups são feitos localmente. A seguir, estão algumas das
questões mais importantes:
Qual é a disposição dos dados no disco? A disposição dos dados no
disco afecta as taxas de transferência, porque determina se o acesso aos
dados é sequencial ou aleatório.
Como estão os discos adaptados ao nível dos logical volumes? A
configuração a nível dos logical volumes de um disco afecta
significativamente a performance dos mesmos. Para adicionar algum nível
de performance ou segurança, é usual envolver a gestão dos logical
volumes usando software ou hardware que implemente RAID. RAID-0
aumenta a performance, mas reduz significativamente a segurança dos
dados. Combinações de RAID-1 e RAID-0 aumenta a performance assim
como a segurança dos dados. RAID-5 também aumenta a performance
assim como a segurança dos dados. No entanto o RAID-5 tem
características de performance que complicam o plano de backup. É
preciso aproximadamente duas a três vezes mais tempo para fazer um
restore do que fazer o backup devido a que a escrita dos dados em RAID-5
é bastante mais lenta do que a leitura.
Como são os discos geridos? Uma outra consideração importante a ter,
é o mecanismo de gestão e configuração dos discos ou dos logical
volumes. As duas possibilidades são RAID por software ou hardware. O
mecanismo por software impõe uma maior sobrecarga no sistema do
servidor do que o mecanismo de RAID por hardware, mas tende a ser mais
flexível.
Qual é a capacidade dos discos? A capacidade individual dos discos
também afecta a performance do sistema. Com os avanços da tecnologia,
os discos tendem a ser cada vez mais rápidos. Quando faz acessos
sequenciais de Input/Output, cada disco possui performances de leitura,
que são limitadas pela implementação de RAID nos volumes.
Projecto - Computadores e Sistemas
52
Planeamento de uma estratégia de backup
4.5
Destino dos dados
Algumas questões chave levantadas a seguir servem como ponto de
orientação para planear todos os factores relacionados com o subsistema
das tapes e o de destino dos dados.
4.5.1
Qual será o subsistema de tapes
O subsistema de tape a utilizar é uma das considerações mais críticas, mas
tende a ser menos complexo do que o subsistema de discos. Na
globalidade, os dispositivos para tapes tendem a ser comparativamente
mais previsíveis e geralmente comportam-se como esperado. A tarefa mais
difícil em relação a um subsistema de tapes tende a ser a instalação e
configuração e não o planeamento. Podem levantar-se as seguintes
questões de forma a elaborar um plano:
Onde residem as drives de tape ? É preciso determinar o modo como
estão as drives de tape instaladas, se stand-alone ou montadas numa
unidade rack carregadas manualmente, ou se estão montadas numa tape
library. As tape library são uma escolha superior para soluções de backup
empresariais. Existem muitas variedades de modelos, que oferecem
capacidades internas de armazenamento de centenas de gigabytes.
Quantas drives de tape existem? É preciso determinar o número de
drives de tapes necessárias para responder a todas as exigências. Não se
pode esquecer também os slots SCSI ou FC-AL nos servidores aos quais
serão ligados estes dispositivos.
Quais são as capacidades da drive de tape? Cada tipo de drive de
tape tem as suas próprias características ou capacidades. Isto inclui
capacidade da tape, eficiência da compressão, compatibilidade com os
formatos das tapes, velocidade de gravação, etc. A taxa de compressão
depende muito do tipo dos dados, mas também depende muito do tipo de
algoritmo utilizado para compressão dos dados.
4.5.2
Como estão distribuídas as drives de tape
É importante optimizar a distribuição das drives de tape pela empresa. Esta
distribuição pode depender de onde é mais vantajoso fazer um esforço e
ligar directamente as drives de tape aos servidores onde residem os dados.
Projecto - Computadores e Sistemas
53
Planeamento de uma estratégia de backup
As questões seguintes podem ajudar a examinar a relação entre as drives
de tape e os dados:
As drives de tape estão todas ligadas ao servidor master? Se todas
as drives de tape estiverem ligadas no servidor master e a maior parte dos
dados estiver em qualquer outra parte, a rede terá de suportar os valores
de transferência de dados desde os clientes remotos até um servidor de
backup central. Esta configuração simplifica a gestão do dia-a-dia à custa
de uma infra-estrutura de rede complexa. Tradicionalmente as redes são os
bottlenecks para as aplicações de backup.
As drives de tape estão ligadas a servidores importantes? Uma
arquitectura eficiente de backup é adicionar drives de tape a servidores
onde residem largas quantidades de dados, atribuir-lhes a tarefa de
servidores slave de backup e fazer a gestão centralizada através de um
servidor master. Com este tipo de arquitectura, apenas viaja pela rede
entre o servidor master e os slaves a informação do registo dos ficheiros.
Qual a distância entre as drives de tape e os dados? A proximidade
entre as drives de tape e os dados afecta normalmente a largura de banda
na rede. Isto porque, distâncias pequenas tendem normalmente a ser
servidas por ligações de maior velocidade. Se as drives de tape e os dados
estiverem separados por centenas de quilómetros, a ligação será lenta.
Pelo contrário, se estiverem no mesmo centro informático, torna-se simples
estabelecer uma ligação ponto a ponto dedicada para os backups entre os
dois locais.
4.5.3
Ambiente que rodeia as tape
O ambiente que rodeia o local onde são utilizadas as tapes influencia a sua
segurança e longevidade. Pode identificar-se as três questões seguintes
como as mais importantes:
Qual é a temperatura e humidade? O ideal para as tape é estarem
num local com uma temperatura moderada e uma humidade relativa baixa.
A temperatura do local pode afectar aspectos como o potencial e a eficácia
da tape, partes sensíveis da drive e a temperatura interior dos
componentes electrónicos da drive. A humidade pode afectar a longevidade
da película magnética da tape. As condições ideais de operação das tapes
são descritas normalmente na embalagem.
Quantas vezes são limpas as cabeças da drive? As cabeças da drive
de tape têm de ser limpas periodicamente porque armazenam detritos com
Projecto - Computadores e Sistemas
54
Planeamento de uma estratégia de backup
o uso contínuo. A operação de limpeza é feita normalmente com uma tape
de limpeza específica.
Quanto tempo têm as drives de tapes e as tapes? À medida que o
tempo vai passando, as drives de tape obtêm um desgaste natural e a
ocorrência de erros é mais frequente. Cada tecnologia de tape tem
associado um MTBF (mean-time-between-failures, tempo médio entre
erros). As estatísticas disponibilizadas pelos produtores tendem a ser
optimistas.
4.6
O trajecto dos dados
Uma das últimas considerações em todo o sistema, é a trajectória que os
dados têm de fazer desde o local onde estão armazenados até à tape à
qual estão destinados. O responsável pode explorar este factor através das
seguintes questões:
4.6.1
Estão os dados e as tape no mesmo local do
servidores de backup?
Se os dados e as tapes estão no mesmo local dos servidores de backup,
deve centrar-se a configuração no modo mais rápido do sistema para
passar os dados entre os dois dispositivos. Também não deve esquecer-se
o meio de suportar potencialmente o largo número de processos envolvidos
na gestão do fluxo dos dados para backup.
É usado o sistema de buffer cache? Os backups são mais eficientes
quando evitam o filesystem buffer cache. A utilização do buffer cache pode
passar pela utilização de acesso directo de Input/Output aos ficheiros
individualmente ou fazer o backup de volumes em bruto.
Qual é a capacidade de memória existente? O sistema de memória é
utilizado principalmente para partilhar regiões de memória de modo a
implementar a comunicação entre os vários processos de backup/restore.
A memória é também usada quando estamos a armazenar o sistema de
ficheiros na cache da memória virtual. Se os dados são armazenados na
memória virtual mais rapidamente do que a carregar as páginas de
memória, o sistema pode começar a ser fustigado.
Qual é o software usado? O software usado determina, na globalidade,
a eficiência de como são transmitidos os dados dos discos para as tapes.
Projecto - Computadores e Sistemas
55
Planeamento de uma estratégia de backup
Por isso, é necessário ter em conta a eficiência do software antes de
comprá-lo, e neste capítulo existem soluções sendo umas melhores do que
as outras.
Quais são as configurações TCP?
Algumas afinações de certos
parâmetros nucleares do TCP ajudam a estabelecer o tamanho dos buffers
usados pelo sistema e a velocidade com que fecha as conexões TCP que
se encontram em estado de espera e, assim, congestionam o sistema.
4.6.2
Estão os dados e os servidores de backup
distribuídos pela rede?
Se os dados estão ligados com o seu eventual destino em tape via uma
rede, o responsável tem de focar a sua tarefa em garantir que essa ligação
não seja interrompida e que existe largura de banda suficiente para
responder aos requisitos mínimos. Para conseguir isto o responsável tem
de considerar as questões seguintes:
Que tipo de rede é? Nem todas as redes se comportam de maneira
semelhante, embora todas tendam a ser descritas ao nível da sua largura
de banda. Diferentes tecnologias de redes têm características diferentes.
Os vários tipos de Ethernet não são muito caros e são comuns, mas a sua
amplitude está limitada a redes locais. Mesmo dentro de redes locais
existem topologias com performances diferentes. A natureza das rede
Ethernet causa um decréscimo da sua largura de banda à medida que mais
nodos estão activos simultaneamente na rede. ATM (Asynchronous
Transfer Mode) e FDDI (Fiber Distributed Data Interface) têm amplitudes
mais longas e degradam-se mais graciosamente sobre maiores cargas. No
entanto, usam conexões em FC, o que as torna menos comuns e mais
caras de instalar. Gigabit Ethernet e FastEthernet cresceram em
popularidade devido à sua familiaridade e facilidade de manejamento.
Quantos clientes estão simultaneamente a partilhar a rede? Se
estiverem todos os clientes activos ao mesmo tempo na mesma rede, é
mais provável que a rede sofra de overload (carga excessiva) do que
quando estão ligados por segmentos.
Projecto - Computadores e Sistemas
56
Planeamento de uma estratégia de backup
4.7
Condições de backup na empresa
As condições para efectuar o backup numa empresa tendem a resumir-se
discretamente a alguns campos. Estes estão principalmente relacionados
com o seguinte:
•
•
•
Fazer o backup dos dados num determinado tempo;
Fazer o restore dos dados conforme for necessário;
Limitar o impacto nas operações diárias da empresa.
O responsável deve investigar detalhadamente estas condições antes de
sugerir uma solução em particular. As questões seguintes dão uma ajuda
para começar essa investigação:
4.7.1
Qual é a janela de backup?
O primeiro passo é determinar a janela de backup. No entanto, a janela de
backup não é um dado, e pode não existir um período de tempo ideal para
efectuar o backup. Algumas aplicações e serviços precisam de estar
disponíveis vinte e quatro horas por dia, sete dias por semana. Nestes
casos, outros métodos para obter backups consistentes precisam de ser
implementados. Em situações extremas, a quantidade de tempo necessário
para efectuar um backup pode exceder o período natural de inactividade.
Estas situações requerem compromissos, nos termos de um dos pontos
seguintes:
•
•
•
•
A que é que estamos a fazer backup;
Frequência de backup;
Disponibilidade dos dados;
Impacto na performance.
Quando é que é menos provável as pessoas terem necessidade de
aceder aos dados? Nas alturas em que a necessidade de acesso aos
dados é menor há uma tendência para criar janelas de backup naturais.
Isto é usual quando menos utilizadores estão no sistema, tipicamente à
noite ou aos fim de semana. Pode haver outros períodos de tempo
previsíveis em que a actividade do sistema é baixa, por exemplo, na hora
de almoço, após o processo trimestral estar completo e nos feriados. Estas
são boas oportunidades para efectuar tarefas de backup. Se estes
períodos naturais de inactividade forem insuficientes é necessário
considerar como ou quando é que podem ser extendidos. O objectivo é
Projecto - Computadores e Sistemas
57
Planeamento de uma estratégia de backup
facilitar a carga em termos de produtividade operacional para fazer backup
a tudo durante a janela de backup.
Qual é a quantidade de dados para fazer backup (completo ou
incremental)? A outra parte da questão é a quantidade de dados a que é
preciso fazer backup. Para um objectivo de recuperação e consistência, o
backup ideal grava o conjunto total dos dados. A parte má é que o volume
dos dados é muito grande, consumindo muito tempo e capacidade nas
tapes. A maior parte das vezes escolhe-se fazer backups completos
ocasionalmente e completá-los com backups incrementais que gravam
apenas as alterações.
4.7.2
Qual é o impacto aceitável ao fazer um
backup?
Se a janela de inactividade não for suficiente para guardar o volume de
dados sem recorrer a gastos em hardware, é necessário estimar o impacto
que isto vai ter no uso normal do sistema. Para minimizar este impacto,
existem algumas opções disponíveis, sem regras exactas, das quais devem
ser seleccionadas as mais adequadas.
A indisponibilidade dos dados é aceite? A principal preocupação deve
ser se os dados podem estar inacessíveis pelos utilizadores por algum
período de tempo. Se isto for possível, é preciso saber quanto desse tempo
pode ser dedicado a fazer backups. Se for possível os dados ficarem
inacessíveis por determinado período de tempo, é possível efectuar o
backup mais rapidamente do que fazê-lo enquanto os dados estão
acessíveis.
A degradação da performance é aceitável? Se os dados precisam de
estar disponíveis permanentemente mas a performance global do sistema
pode ser um tanto menor, uma escolha possível é continuar a concorrência
entre fazer os backups e utilizar normalmente o sistema. Existem vários
mecanismos para backups online, cada um deles com um grau diferente de
impacto na performance. O responsável precisa de atingir uma solução de
compromisso e escolher a melhor solução possível.
Durante quando tempo é aceitável a degradação da performance?
Se a indisponibilidade dos dados ou a degradação da performance forem
aceitáveis, é preciso determinar o período de tempo que não deve ser
excedido. Este período de tempo é normalmente mais pequeno para a
disponibilidade dos dados do que para a performance, mas uma menor
performance pode conduzir a uma menor produtividade, pelo que deve ser
minimizado.
Projecto - Computadores e Sistemas
58
Planeamento de uma estratégia de backup
Se são usadas bases de dados existem módulos apropriados
disponíveis? Nem todas as bases de dados comerciais tem módulos de
backup próprios e, se for necessário fazer o backup destes dados deve
verificar-se se existem módulos apropriados disponíveis para corrigir esta
situação.
4.7.3
Que
preocupações
relativamente
disponibilidade deve visar a solução?
à
Cada solução deve visar as preocupações reais e os objectivos do cliente.
Por exemplo, uma boa solução para tentar reparar ficheiros apagados
acidentalmente não é provavelmente uma boa solução para recuperar
completamente de uma situação de destruição total. Para começar a
pensar nos assuntos relevantes, pode levantar-se as três questões
seguintes:
É critico minimizar o impacto do erro do utilizador ou operador?
Se a maior preocupação é a perda de ficheiros individuais, a solução deve
ser planeada de modo a recuperar o ficheiro rapidamente com o mínimo
esforço por parte do administrador. Os assuntos de menor importância
incluem o armazenamento de tapes, duplicação e importação/exportação
para off-site. Um dos assuntos importantes é a frequência de backup
porque a cópia da tape deve ser a mais próxima possível do estado final do
ficheiro. Para responder a estas necessidades, devemos pensar numa
solução baseada em discos, em vez de tapes.
É critico minimizar o impacto da perda de equipamento? Para
reduzir a possibilidade de perder dados devido a falha de hardware, pode
implementar-se mecanismos como o RAID. O impacto de falhas de
hardware revelam a necessidade de alta disponibilidade e implementação
de clusters.
É critico minimizar o impacto em caso de desastre? A preparação
de uma recuperação de desastre deve envolver todos os aspectos das
operações a efectuar. Isto vai desde o treino do pessoal interveniente, para
todos saberem qual a sua missão no caminho para repor a normalidade.
Normalmente, os passos mais comuns passam por possuir várias cópias
dos dados e uma destas estar no local e as outras distribuídas por outros
locais. Outra hipótese é existir um outro local para onde possam ser
importados os dados e assim restaurar o serviço. Algumas empresas
escolhem soluções mais drásticas, que por vezes utilizam, que é a
construção de um hot-site onde será possível iniciar o funcionamento
normal da empresa numa questão de minutos depois do desastre, com
uma configuração com as mesmas características do local original. Já
existem situações de completo “cluster de edifícios” para, em caso de
Projecto - Computadores e Sistemas
59
Planeamento de uma estratégia de backup
desastre total, ser possível restabelecer o funcionamento da empresa com
a mobilização de pessoas e dados no mínimo espaço de tempo possível.
4.8
Expectativas
Uma parte sensível da capacidade de planear uma estratégia é manter as
expectativas realistas. Isto é importante porque alguma confusão em
determinadas áreas pode causar um número desproporcionado de
problemas.
4.8.1
Compressão
A compressão pode ser problemática por uma série de razões. A mais
relevante é que os benefícios da compressão variam muito com o tipo de
dados a comprimir assim como com o mecanismo de compressão utilizado.
Com o mesmo mecanismo de compressão com diferentes tipos de dados
obtemos graus diferentes de compressão. Alguns tipos de dados, como o
vídeo por exemplo, possuem pouca ou nenhuma redundância para
eliminar. A compressão por hardware da drive tape usa tipicamente um
pequeno buffer onde deposita a informação à medida que vai fazendo a
compressão. O tamanho deste buffer limita a quantidade de dados que
podem ser examinados em busca de padrões redundantes. Por fim, o
tempo necessário para localizar todos os padrões redundantes pode ser
maior do que o tempo válido para o mecanismo de compressão. Isto
acontece porque a compressão tem de acontecer em tempo real, enquanto
os dados são passados para a tape.
As pessoas esperam muitas vezes relações de compressão 2:1,
frequentemente descritas em literatura sobre hardware de tape, ou
esperam relações de compressões similares, à medida que vêem esta
capacidade em utilitários de compressão como o Compress, GNUzip, etc.
Quando eram testados diversos tipos de dados, na realidade, as relações
de compressão eram bastante menores.
Relações de compressão de alguns tipos de dados são mostrados na tabela
a seguir.
Projecto - Computadores e Sistemas
60
Planeamento de uma estratégia de backup
Tipo de dados
Relação de
compressão
Texto
JPG
1,44:1
0,92:1
Base de dados
1,57:1
Tabela 13 – Relações de compressão de ficheiros.
4.8.2
Overhead
O software de backup guarda numa base de dados os ficheiros que estão
na tape, sendo um registo de cada instância de ficheiro. É necessário uma
estimativa de 150-200 bytes por registo de cada ficheiro. Estes valores
dependem de software para software. Como exemplo, se se pensar numa
base de dados com um milhão de registos, será preciso mais ou menos 150
a 190 MB. É preciso planear com segurança a existência de espaço para
acomodar esta base de dados no disco e implementar uma tarefa regular
de backup a estas bases de dados. O software também escreve alguma
quantidade de metadados na tape, de forma a guardar a sequência do que
está a ser escrito na tape. Este volume de dados não chega a atingir um
por cento da capacidade da tape.
4.8.3
Performance do restore
Outro erro normal no planeamento é assumir que a performance do restore
é idêntica à do backup. Dados indicativos sugerem que devemos contar
com uma performance três vezes mais lenta do que um backup. Por várias
razões, a escrita demora mais tempo do que a leitura. Por exemplo, criar
ficheiros requer um sincronismo rigoroso na escrita para actualizar os
metadados guardados com a informação do ficheiro. Estas actualizações
têm de correr de forma correcta para preservar a integridade dos ficheiros.
Outra forma de os restores serem mais lentos, é a necessidade de procura
introduzida no começo do restore. Quando é necessário fazer o restore de
determinados ficheiros o software precisa de localizar esses ficheiros na
base de dados. Esta procura pode demorar algum tempo em base de
dados contendo milhares de registos.
Projecto - Computadores e Sistemas
61
Planeamento de uma estratégia de backup
4.8.4
Facilidade
formação
de
utilização
e
necessidade
de
O software actual de gestão de backups oferece poderosas características
por detrás de ambientes gráficos fáceis de utilizar. No entanto, toda a área
de backup e protecção dos dados é muito complexa, e inevitavelmente
obrigará a tomar decisões complexas que irão afectar o sucesso da
instalação a longo termo. Isto requer treino nos produtos envolvidos,
experiência de utilização e uma compreensão mínima das soluções.
A abordagem com mais sucesso é trazer consultores especializados para
instalar e configurar o sistema para as necessidades correntes e para
ensinar no local aos técnicos as ideias base de manutenção e operação do
sistema configurado. O técnicos terão depois de desenvolver todo um
conhecimento para estarem capazes de alterar a configuração para
aumentar a exigência. Isto pode ser alcançado com mais treino ou outros
meios.
4.9
Medidas e Cálculos
Um número simples de medidas técnicas e cálculos é útil para atingir uma
correcta capacidade para decidir. As secções seguintes deverão fornecer o
necessário background e ferramentas para
4.9.1
Capacidade da rede
Existem muitas tecnologias de rede hoje em dia, e mais nascerão com a
evolução tecnológica. Cada tecnologia tem as suas características e
complexidades próprias. Entre dois pontos podem existir múltiplos
caminhos e cada um desses caminhos pode ter uma largura de banda
diferente. Todos estes factores constituem um desafio para tentar
compreender a estrutura da rede da empresa.
Princípios
Existem algumas técnicas simples que podem ser usadas para planificar a
implementação da rede. Quando trabalhamos perante uma rede que não
possui uma rede para os backup, o objectivo consiste em conseguir a
largura de banda suficiente entre o local dos dados e o drive de backup.
Isto pode ser conseguido através da alocação de links múltiplos entre a
fonte e o destino enquanto a largura de banda global não for adequada. A
tabela a seguir mostra algumas tecnologias e suas performances.
Projecto - Computadores e Sistemas
62
Planeamento de uma estratégia de backup
Tecnologia
ISDN (RDIS)
Frame Relay 256
Frame Relay 512
T1
T3
Ethernet (10BaseT)
FastEthernet ( 100BaseT)
GigabitEthernet ( 1000BaseT
FDDI
CDDI
ATM 155
ATM 622
HIPPI-s
Velocidade
Teórica
Velocidade
Real
128 Kb/sec.
256 Kb/sec.
10 Kb/sec.
20 Kb/sec.
512 Kb/sec.
1,54 Mb/sec.
44,7 Mb/sec.
10 Mb/sec.
100 Mb/sec.
1000 Mb/sec.
100 Mb/sec.
100 Mb/sec.
155 Mb/sec.
622 Mb/sec.
800 Mb/sec.
39 Kb/sec.
115 Mb/sec.
3,4 Mb/sec.
0,75 Mb/sec.
7,5 Mb/sec.
50 Mb/sec.
8 Mb/sec.
8 Mb/sec.
11,6 Mb/sec.
50 Mb/sec.
60 Mb/sec.
Tabela 14 – Tecnologias de rede e suas performances.
Na realidade, a maior parte dos ambientes já contém um investimento
significativo em infra-estrutura de rede que pode ser utilizada para backup
e restore.
O primeiro passo é fazer um levantamento de toda a rede. Muitas das
empresas têm esse levantamento já feito com informação necessária. A
meta será produzir um mapa com todos os links relevantes da rede em
relação ao outro. Depois, registar a sua necessidade de largura de banda
durante a janela de backup projectada porque a rede pode estar a ser
utilizada por utilizadores e assim não disponibilizar toda a sua largura de
banda.
Após o mapa da infra-estrutura estar disponível, é preciso localizar o ponto
central na rede. Este é o ponto que possui mais acessos e bastante largura
de banda. Este ponto central é o local ideal para instalar o servidor master
de backup do ponto de vista da rede. Depois de o servidor master estar
instalado é preciso estimar a largura de banda disponível dos vários pontos
com dados até ao servidor master.
Se esta estimativa mostrar que se esta perante um bottleneck na rede,
deve considerar a instalação de servidores slaves em alguns segmentos de
rede.
Projecto - Computadores e Sistemas
63
Planeamento de uma estratégia de backup
4.9.2
Capacidade do sistema
A performance do backup pode sofrer impactos devido a vários aspectos da
configuração do sistema. Quando se planeia configurar um servidor
existente para um backup local, a maior parte das escolhas já estão feitas.
As decisões remanescentes consistem em adicionar quaisquer placas I/O
para acomodar dispositivos de hardware da tape, aumentar a memória e
unidades CPU, caso o sistema já esteja em máxima utilização. O número
de placas I/O adicionais necessárias depende do número de dispositivos
que precisam de ser configurados.
Para simplificar a configuração da capacidade do CPU, o responsável pode
estimar quantos ciclos de CPU são necessários para mover os dados numa
determinada taxa. Por exemplo, um sistema que precise de fazer o backup
a um número de clientes da rede para uma tape local a uma taxa de 10
MB/seg, necessita de 100 MHz disponíveis de CPU. Isto inclui 50 MHz para
mover os dados desde a rede até ao servidor e outros 50 MHz para mover
os dados do servidor para as tapes. Isto manteria um processador a 300
MHz a 33 % de utilização. Como outro exemplo, um sistema que precise de
fazer um backup a uma base de dados residente nos discos locais para
dispositivos de tape locais a uma taxa de 35 MB/seg. precisaria de 350 MHz
disponíveis de CPU. O overhead actual do software é pequeno e está
incluido no número de 5 MHz por MB/seg.
4.10 Conclusão
O backup e o restore são processos essenciais devido ao grande volume de
dados guardados nos centros de dados actuais. Assim, o papel do
responsável pelo planeamento é vital para elaborar uma óptima estratégia
de backup para as necessidade dos centros de dados e sistemas.
A capacidade de planeamento não é um procedimento para ser seguido à
risca, é necessário saber utilizar eficientemente a infra-estrutura da rede e
compreender os assuntos de performance da rede e da largura de banda.
O responsável precisa de configurar a rede para uma eficiente performance
do backup e do restore porque as redes são tradicionalmente o bottleneck
para as aplicações de backup.
Durante um processo complexo o responsável pode seguir uma série de
regras e usar ferramentas e métodos disponíveis de modo a obter a
informação necessária para escolher a melhor opção. Em primeiro lugar
Projecto - Computadores e Sistemas
64
Planeamento de uma estratégia de backup
precisa de aceder ao ambiente onde será feito o backup. Isto inclui a
obtenção da seguinte informação:
•
•
•
•
•
Tipo de dados;
Estrutura de Ficheiros;
Origem dos dados;
Destino dos dados;
O caminho dos dados.
O responsável também precisa de saber se os dados e os servidores de
backup estão distribuídos na rede e a forma como estão distribuídos.
Conhecer as necessidades de backup da empresa também é essencial. Isto
inclui determinar o período de tempo disponível para backup, a
necessidade de fazer o restore dos dados e as formas para limitar o
impacto do processo nas operações do dia a dia.
Finalmente, o responsável precisa de manter expectativas realistas. Isto
significa ter em conta os dados de overhead causados por metadados
adicionais, compreender a facilidade de utilização no processo de backup,
aceder a necessidades de formação e compreender a performance de
restore.
Projecto - Computadores e Sistemas
65
Capítulo
5
Soluções: Vantagens &
Desvantagens
Soluções: Vantagens & Desvantagens
5.1
O ponto de partida: Backups distribuídos
Para várias empresas, o crescimento dos servidores e da capacidade de
armazenamento conduziu a uma infra-estrutura com base em tapes e a
uma estratégia de backups distribuídos.
Neste tipo de estratégia, são feitos backups independentes a cada servidor
para uma drive de tape local. Se se estiver perante um ambiente
heterogéneo onde existem vários tipos de sistemas instalados (Unix,
Netware, NT, etc.), diferentes tipos de drive de tape e diferentes softwares
de backup, este tipo de estratégia é uma solução pouco ideal.
Servidor D
com scripts
Unix
Servidores de
aplicações e
ficheiros
Servidor A
com Arkeia
Mammoth
Tape drive
Servidor B
com Backup
Exec
DLT7000
Tape drive
DLT4000
Tape drive
Servidor C
ARCServe
ADR
Tape drive
Figura 7 – Backup local a cada servidor.
Vantagens
Não requer grande investimento em aquisições
A despesa que se vai propagando ao longo do tempo, está relacionada
com a compra de novos servidores.
Projecto - Computadores e Sistemas
67
Soluções: Vantagens & Desvantagens
Desvantagens
Os custos de formação e de trabalho são elevados
Devido à grande necessidade de intervenção manual nas tarefas diárias
do sistema, existe uma maior probabilidade de erro humano. O pessoal
necessitaria de grande formação para ficar ao corrente dos diferentes
tipos de software de backup existentes.
A segurança da solução é baixa
Com tantas combinações diferentes de software e hardware a serem
utilizadas, o pessoal informático tem dificuldade em manter a
operacionalidade do sistema. A arquitectura distribuída faz com que a
identificação do sucesso ou do insucesso dos backups na empresa seja
bastante difícil e, quando se torna tão difícil identificar as falhas de um
backup, há uma tendência para que a incorrecção perdure por muito
tempo.
Os custos de manutenção do hardware, das tapes e dos
dispositivos de gravação de tapes são elevados
Os dispositivos de gravação são utilizados com insuficiência devido à
arquitectura distribuída da solução. Em consequência, são necessários
mais dispositivos de gravação em tape e mais tapes do que seria
necessário para uma abordagem mais centralizada.
Os custos de verificação da operação de backup são muito
elevados
A integridade dos dados de backup é frequentemente pouco clara visto
gastar-se muito tempo a realizar testes de verificação para uma grande
quantidade de servidores de backup. Como consequência, estes tipos
de testes são quase sempre suprimidos, o que faz com que o negócio
corra o risco de perda de dados devido aos backups sem sucesso.
Projecto - Computadores e Sistemas
68
Soluções: Vantagens & Desvantagens
5.2
O primeiro passo: Centralização do backup
Quer se queira fazer contenção de custos, melhorar a segurança do backup
e do restore ou ambos, o primeiro passo a tomar é o mesmo – uniformizar
na mesma empresa um software de backup e centralizar o controlo num
ponto único.
Se o volume de dados nos servidores for moderado e a LAN tiver largura
de banda suficiente, poder-se-á utilizar uma estratégia de backup simples
para proteger por completo os dados, como se pode verificar na figura
seguinte.
Servidor de
Backup
Posto de
gestão de
backups
A
Servidor de
Backup cliente
Servidores de
aplicações e
ficheiros
B
Servidor de
Backup cliente
C
Servidor de
Backup cliente
Figura 8 – Backup centralizado num servidor.
Vantagens
Redução de custos em dispositivos de gravação de tapes
Deixa de ser necessário a existência de um para cada servidor.
Redução de custos em tapes e na sua manutenção
São necessárias menos tapes visto que o uso parcial é reduzido.
Redução de custos na manutenção e formação do software
Formação para um único software.
Projecto - Computadores e Sistemas
69
Soluções: Vantagens & Desvantagens
Aumento da segurança
Monitorização e gestão centralizadas.
Níveis de serviço consistentes
As políticas de backup standard são facilmente aplicadas a toda a
rede.
Níveis de serviço melhorados
O restore dos dados pode ser feito desde a tape, mais facilmente e
com maior segurança, sempre que necessário.
Procedimentos de restore urgentes mais fáceis e mais
rápidos
Uma tecnologia de tape simples e formatação de dados são agora
utilizados, permitindo um acesso mais simples e mais fácil ao backup
de dados quando tal é mais importante – numa emergência.
Risco reduzido de não detecção de falha do backup
As tapes podem ser testadas rápida e eficazmente de forma a
verificar o sucesso do backup e a legibilidade dos dados.
Desvantagens
Requer uma selecção de software e hardware padrão
Por vezes será necessário escolher, planificar e desdobrar a solução.
Consumo da largura de banda da LAN
Com todo o movimento existente na LAN, o backup centralizado
pode utilizar uma grande parte da largura de banda disponível,
colidindo com a realização de outras aplicações. Esta situação pode
ser atenuada através da colocação de uma LAN separada, dedicada
ao movimento de backup.
Projecto - Computadores e Sistemas
70
Soluções: Vantagens & Desvantagens
5.3 Melhorar as operações de backup: Automatização
com Tapes Libraries
Devido ao aumento do volume dos dados, atinge-se, inevitavelmente, o
ponto em que é necessário mais capacidade de armazenamento de backup
do que as tapes normais permitem. Assim surge a necessidade de utilizar
tape libraries.
Posto de
gestão dos
backups
A
Servidor de
Backup cliente
Servidor de
backup
Servidores de
ficheiro e
aplicações
B
Servidor de
Backup slave
Tape Library
robotizada
C
Servidor de
Backup slave
Figura 9 –Backup automatizado com utilização de tape library.
As tape libraries complementam, com bastante eficácia, a centralização de
backup e ambas são implementadas conjuntamente.
Vantagens
Aumento da segurança do backup
Pequenos erros ou ausência do pessoal não afectarão as operações
normais e automatizadas de backup.
Melhoria dos níveis de serviço
Projecto - Computadores e Sistemas
71
Soluções: Vantagens & Desvantagens
Pode ser feito um restore dos ficheiros a partir do backup muito
mais rapidamente quando a tape relevante está armazenada na tape
library.
Redução de custos laborais
As tape libraries automatizadas requerem muito menos intervenção
manual do que as soluções de backup baseadas em dispositivos de
gravação em tape locais aos servidores. Frequentemente, isto liberta
uma quantidade significativa de tempo que pode ser utilizado em
actividades mais estratégicas e mais valorizadas, produzindo custos
significativos para o negócio.
Desvantagens
Custo da compra
Tal como esta, qualquer tipo de consolidação de software que inclua
uma consolidação de tape, requer uma mudança consciente de
abordagem e alguns gastos.
Projecto - Computadores e Sistemas
72
Soluções: Vantagens & Desvantagens
5.4 Maiores necessidades de produtividade operacional:
Partilha de Tape Libraries
Apenas alguns servidores com grandes quantidades de dados podem
encher de tráfego a LAN durante um backup, ou até mesmo durante um
restore de emergência. A solução é retirar esse movimento de backup da
LAN e a partilha da tape library é um meio efectivo para o conseguir. Aqui
está uma simples implementação desta arquitectura.
A
Tape Libray robotizada
com multiplas drives
Servidor
Master de
Backup
Posto de
Gestão dos
Backups
Servidores de
ficheiro e
aplicações
A
Servidor de
Backup Cliente
B
Servidor de
Backup Slave
C
Servidor de
Backup Slave
Figura 10 – Partilha da tape library a outros servidores.
Uma partilha da tape library funciona como é demonstrado no diagrama
seguinte – cada posto liga-se directamente a uma ou mais drives de tape
na tape library. Um dos postos faz a gestão do robot e executa
movimentos de acesso às tapes para os pedidos dos postos ligados.
Projecto - Computadores e Sistemas
73
Soluções: Vantagens & Desvantagens
Servidor de
backup slave
Servidor de
backup slave
Servidor de
backup master
Posto de
gestão dos
backups
Tape Library
robotizada
Figura 11 – Funcionamento da partilha da tape library.
Vantagens
Backup mais rápido e restore de servidores com grande
volume de dados
A LAN já não é um bottleneck para os servidores slaves com
grandes quantidades de volumes de dados.
Aumento da produtividade operacional dos backups
Os servidores slave podem normalmente seleccionar uma partilha do
backup.
Impacto reduzido na LAN
Os dados armazenados nos servidores slave de backup, são
copiados directamente para uma drive de tape via SCSI e, por
conseguinte, passam por cima da LAN. Ao fazer-se a escolha dos
servidores aos quais deve ser feita uma ligação directa, é possível
mover uma grande parte do movimento de backup da LAN.
Permitir outras aplicações baseadas em tapes
Caso se queira implementar outras aplicações baseadas em tapes,
tais como document imaging ou arquivo de dados, estas poderão
partilhar a tape robot com as aplicações de backup. O custo
incremental de implementar estas aplicações é em grande parte
reduzido através da reutilização de tal hardware.
Projecto - Computadores e Sistemas
74
Soluções: Vantagens & Desvantagens
Desvantagens
A disposição do centro de dados é limitada
Todos os servidores slave de backup devem estar dentro dos limites
de distância do SCSI (tipicamente cerca de 20m) da tape library
partilhada, o que impõe determinadas restrições na disposição da
sala.
Aumento dos custos de hardware
Normalmente, o aumento da produtividade operacional exige a
compra de drives de tape adicionais, não importando qual a
arquitectura utilizada.
Maior complexidade
Os administradores de backup devem ter em conta um grande
número de servidores slave ao fazerem a gestão dos esquemas de
backup.
Uma tape library central muilti-usos pode permitir um grande retorno do
investimento através das economias no trabalho e da melhoria dos níveis
de serviço. No entanto, visto que a implementação pode ser complicada,
deve ter-se a certeza da sua necessidade.
Projecto - Computadores e Sistemas
75
Soluções: Vantagens & Desvantagens
5.5 Optimização dos recursos: Ligação por FC à Tape
Library
Acumular a actividade operacional de backup e da LAN numa solução de
partilha da tape library com ligações SCSI, torna-se rapidamente
dispendioso, visto uma ou mais drives de tape terem de ser dedicadas a
postos com um grande volume de dados para backup. A utilização de um
switch channel de FC pode ser a solução para este problema.
Tape Library robotizada
com ligação por fibra
óptica às drives de tape
Servidor de
backup
master
Posto de
gestão dos
backups
A
Servidor de
backup cliente
Servidores de
aplicações e
ficheiros
B
Servidor de
backup slave
C
Servidor de
backup slave
Figura 12 – Ligação por FC à tape library.
Vantagens
Redução dos custos pela utilização mais eficiente dos
recursos da tape
Uma vez que, nesta solução, as drives de tape podem ser
adjudicadas para onde são mais precisas, são necessárias menos
Projecto - Computadores e Sistemas
76
Soluções: Vantagens & Desvantagens
quantidades no total. Isto significa que tanto se poupa nos custos de
compra como na manutenção do hardware.
Redução dos custos na aquisição diferida de tape library
Com a necessidade de um número mais reduzido de drives de tape,
é menos provável que seja preciso uma tape adicional meramente
para alojar drives de tape adicionais.
Melhoria dos tempos de backup e restore em caso de
urgência
Numa situação crítica, uma grande parte ou até todas as drives de
tape ligadas podem ficar disponíveis para um servidor de modo a
fazer-se um restore ou um backup rápido.
Desvantagens
Custos iniciais de infra-estrutura
A utilização do switch de FC,
permite um bom retorno do
investimento, mas, naturalmente, também requer uma despesa
maior na instalação da infra-estrutura inicial.
Aumento da complexidade
Uma vez ligadas, as drives de tape dinamicamente adjudicadas
requerem uma configuração e uma gestão muito mais cuidadas do
que as drives de tape que estão ligadas via SCSI e que se dedicam
indefinidamente a um único servidor.
Outra estratégia para impedir o congestionamento da LAN é a
implementação de uma LAN de backup dedicada. Esta estratégia tem prós
e contras, mas vale a pena ser considerada, mesmo que tal seja feito em
conjunto com outras estratégias.
Projecto - Computadores e Sistemas
77
Soluções: Vantagens & Desvantagens
5.6 Minimizar o impacto na produção: Rede dedicada
de Backup
Se o movimento de backup estiver a inundar a rede LAN, uma das soluções
possíveis é instalar uma LAN separada, dedicada ao movimento de backup
e restore. A rede de backup apenas necessita de ligar o servidor de backup
e os clientes de backup com grandes quantidades de dados – obviamente
que não há necessidade de extensão aos postos de trabalho ou aos
servidores com pouca quantidade de dados. Esta é uma estratégia
relativamente económica que permite minimizar o congestionamento
causado pelo movimento de backup.
Servidor de
backup
Posto de
gestão dos
backup
A
Servidor de
backup cliente
Tape Library
robotizada
Servidores de
aplicações e
ficheiros
B
Servidor de
backup cliente
C
Servidor de
backup cliente
Figura 13 – Rede dedicada de backup.
Projecto - Computadores e Sistemas
78
Soluções: Vantagens & Desvantagens
Vantagens
Minimiza o impacto na rede durante os backups
A carga do movimento de backup faz-se agora numa rede de
backup dedicada, que previne o congestionamento na rede principal.
Melhoria da produtividade operacional da rede
O congestionamento da rede tanto funciona com o movimento do
backup colidindo com o operacional, como vice-versa. Uma rede
dedicada de backup permite que os backups corram sem
impedimentos na produtividade operacional da rede.
Reduz os custos
Relativamente a outras medidas disponíveis para melhorar a
performance do backup, a rede dedicada de backup tem o custo
mais reduzido.
É de fácil implementação e gestão
A rede dedicada de backup pode ser instalada, configurada e gerida
pelo pessoal ou consultores de redes existentes na empresa.
Desvantagens
A produtividade operacional do backup ainda é limitada pela
rede
Uma rede dedicada de backup melhorará, definitivamente, a
produtividade operacional do backup, mas na maior parte dos casos,
a rede continuará a ser o bottleneck da performance na solução.
Uma maior complexidade conduz a uma gestão mais difícil
da solução de backup
O servidor de backup e cada cliente de backup, terá agora, no
mínimo, duas interface cards de rede (NICs) e dois endereços de IP.
Inevitavelmente, isto aumenta a complexidade do ambiente e da
solução de backup.
Uma rede dedicada de backup não é a solução para todos os problemas de
performance de backup – não é mais do que uma das estratégias
disponíveis. Frequentemente haverá necessidade de combiná-la com outras
técnicas de modo a criar uma solução polivalente.
Projecto - Computadores e Sistemas
79
Soluções: Vantagens & Desvantagens
Zonas diferentes de segurança e firewalls introduzem complexidades
adicionais a uma solução de backup, mas como atingir a redução de custos
permitida pelas soluções geridas centralmente, sem comprometer a
segurança do processo. A solução poderá passar por uma simples
arquitectura de segurança de backup.
5.7
Backup e Segurança Centralizados
Ampliar uma solução de backup para proteger os dados numa zona de
segurança diferente requer um plano cuidadoso. Neste caso, a necessidade
de evitar comprometer a segurança pode entrar em conflito com um dos
principais objectivos de solução de backup da empresa – utilizar uma
gestão centralizada como um meio para reduzir os custos operacionais.
Como exemplo simples, considere-se um cenário no qual uma solução de
backup em tape deve ser expandida para também abranger os servidores
internet, fora da firewall colectiva. Nos problemas que surgem de imediato
podem incluir-se os seguintes:
1. As regras do firewall têm de ser modificadas para permitir alguns
tipos de movimentos entre os servidores situados fora do servidor e
o servidor de backup geral. É importante minimizar o alcance
desejado da mudança, por forma a assegurar a não degradação da
segurança em qualquer circunstância.
2. O backup é um dos maiores consumidores de largura de banda
entre todas as aplicações de rede. Caso exista uma quantidade
substancial de dados fora da firewall, é provável que esta demonstre
um maior bottleneck para os backups. Também o movimento de
dados necessário para os backups, poderá causar graves
congestionamentos na firewall, causando, possivelmente, um golpe
inaceitável na performance das aplicações visíveis dos clientes.
A melhor solução para ambos os problemas mencionados poderá ser a
instalação de um servidor slave de backup fora da firewall, ligado
directamente a uma drive de tape na tape library através de um adaptador
SCSI ou Fibre Channel. Esta arquitectura é mostrada de seguida.
Projecto - Computadores e Sistemas
80
Soluções: Vantagens & Desvantagens
Tape Library com
multiplas drives de tape
Posto de
gestão de
backups
A
servidor de
backup cliente
Servidores de
aplicações e
ficheiros
B
servidor de
backup cliente
Servidor de
backup
C
D
servidor de
servidor de
backup cliente backup cliente
E
servidor de
backup slave
Figura 14 – Rede de backup com firewall.
Este esquema apresenta a resolução para o segundo problema, passando a
carga do movimento do backup pela firewall – os dados são copiados dos
servidores client de backup (C e D, em cima) para o servidor slave (E) e
escrevendo directamente daí para a tape.
O único movimento adicional através da firewall consiste nos comandos de
controlo enviados pelo servidor de backup master para o slave e a
informação de actualização do estado enviada de volta pelo outro caminho.
Na prática, este método poderá reduzir o movimento de backup através da
firewall em cerca de 98%.
Os assuntos relacionados com a segurança também são suavizados em
grande escala: as únicas alterações às regras de firewall estão relacionadas
com a permissão de movimento nas vias de acesso específicas, usadas pela
aplicação de backup para trocar comandos e informação entre o master e o
slave. Este tipo de movimento deve somente ser permitido entre os
servidores de backup master e slave. Todas as outras restrições devem ser
mantidas.
É de notar que é importante verificar antecipadamente se o software de
backup é firewall friendly; por outras palavras, se ele pode ser configurado
para utilizar apenas um específico e limitado conjunto de vias de acesso de
comunicação das firewalls. O ideal seria que as vias de acesso utilizadas
pelo software de backup pudessem ser configuradas, permitindo que
pudessem ser ajustadas a valores que não são utilizados por outras
Projecto - Computadores e Sistemas
81
Soluções: Vantagens & Desvantagens
aplicações ou servidores no interior da empresa. Esta é uma medida
adicional para apertar de forma mais consistente a segurança da solução.
Vantagens
Minimiza o impacto nas firewalls durante os backups
A informação para backup viaja agora directamente do servidor
client para o servidor de backup slave. Isto significa que há menos
impacto na performance para os servidores e aplicações de Internet.
Aumenta a produtividade operacional do backup
A eliminação da passagem pela firewall, irá
aumentar
substancialmente a produtividade operacional do backup, reduzindo
proporcionalmente a janela de backup.
Melhora a segurança
A necessidade de menos alterações da firewall significa menos
impacto na segurança devido à implementação da solução de
backup.
Custos operacionais mais baixos
Grande parte dos custos relacionados com uma solução de backup
ficam sujeitos às operações de monitorização e gestão do servidor
master. Desde que esta arquitectura usa um servidor slave adicional
em vez de um segundo servidor master independente, fora da
firewall, mantém os custos operacionais da solução no limite
mínimo.
Desvantagens
Custos mais elevados do que uma simples abordagem de
rede cliente
Adicionalmente a uma licença do software cliente para cada posto
fora da firewall, ao qual deve ser feito o backup, esta solução
também requer a compra de uma licença para o servidor slave e
uma drive de tape adicional na tape library.
Continua a existir riscos na segurança (embora reduzidos)
Uma abordagem cautelosa à segurança realça o facto de que
Projecto - Computadores e Sistemas
82
Soluções: Vantagens & Desvantagens
qualquer atenuação às regras duma firewall aumenta o risco de uma
violação da segurança. Contudo, a maior parte dos especialistas em
segurança que reviram as mudanças necessárias na firewall para
implementar esta arquitectura, admitiram que estas não eram
suficientes para pôr em risco a segurança e concluíram que o risco
associado era mínimo.
Projecto - Computadores e Sistemas
83
Soluções: Vantagens & Desvantagens
5.8 Proteger o futuro do negócio – Computadores
Portáteis e Desktop
Enquanto os exemplos anteriores estavam todos relacionados com a
protecção dos dados do servidor, é de notar que a empresa também tem
em jogo informação de grande valor, armazenada em computadores de
secretária (desktop) e portáteis. Em muitas empresas nenhum
departamento em particular tem a responsabilidade de proteger esta
informação e, como consequência, é frequentemente negligenciada na
totalidade – até que se torna tarde demais. Não se pode cair nesta
armadilha.
Um computador portátil:
Uma ferramenta vital no negócio
As ferramentas essenciais dos negócios actuais incluem: agenda,
telemóvel, email, computador portátil, etc. Tal como acontece com muitos
profissionais especializados, é provável que se confie fortemente no
portátil, no decurso de cada dia de trabalho.
Mas que impacto teria se de repente se perdesse o computador?
O que aconteceria se o computador tivesse um problema de hardware e
precisasse de manutenção? Provavelmente só voltaria da reparação
passado uma semana ou mais, o que causaria um grande impacto na
produtividade do dia a dia.
O que aconteceria se se perdesse o portátil, se este fosse roubado ou se
tivesse uma falha no disco duro? Haveria uma hipótese de 88% de isto se
tornar uma catástrofe, isto porque, a 88% dos computadores portáteis e
Projecto - Computadores e Sistemas
84
Soluções: Vantagens & Desvantagens
desktop nunca foi feito qualquer backup. Neste caso, os dados estariam
perdidos para sempre.
Caso verídico:
Um computador portátil foi roubado de um quarto de hotel em
Queensland, na Austrália. O dono lançou um apelo público para recuperar
os dados do computador – 4 anos de resultados desportivos e outras
estatísticas da equipa olímpica, da qual ele era o treinador. O seu
computador tinha a única copia desta informação vital. Não havia backups.
Nem o computador nem os dados foram recuperados.
A solução para Backup dos computadores portáteis e de secretária
A forma ideal de proteger os dados num computador portátil ou de
secretária é utilizar uma solução que permita:
Correr o backup automaticamente - sem necessidade de fazer seja
o que for.
Uma utilização simples – não havendo necessidade de cursos de
formação ou de manuais.
Não haver necessidade de transporte de disquetes ou tapes.
Proteger sempre com segurança os dados – quer se esteja no
escritório ou fora dele.
Adaptação ao trabalho de rotina – em vez de ser necessário alterar
o que se faz normalmente.
Ter o mínimo impacto na rede LAN e WAN da empresa.
Colocar apenas os requisitos mínimos no departamento de TI.
Permite uma recuperação rápida “self service” dos dados perdidos
ou apagados – em qualquer altura e sem qualquer necessidade de
intervenção do pessoal do help desk.
Projecto - Computadores e Sistemas
85
Soluções: Vantagens & Desvantagens
Reconstruir rapidamente o PC caso este se perca, seja roubado ou
avarie – estabelecer novamente a produtividade no mínimo espaço
de tempo.
Projecto - Computadores e Sistemas
86
Capítulo
6
Ferramentas de
gestão e manutenção
de backups
Projecto - Computadores e Sistemas
87
Ferramentas de gestão e manutenção de backups
6.1
Introdução
Os softwares de gestão de backups são verdadeiras aplicações
Cliente/Servidor para transferência de grandes quantidades de dados a alta
velocidade via redes TCP/IP. Em geral, são modulares (existem n módulos
para funções específicas que são comprados à parte) e centralizam todas
as funções de acesso, organização dos dados e dispositivos de
armazenamento, além de executarem operações de segurança, como o
backup.
Suportam uma enorme classe de clientes com diferentes sistemas, desde o
Linux, os mais populares sistemas Unix, todos Windows quer sejam
workstations ou servidores, Novell e alguns sistemas menos conhecidos.
Arquitectura Cliente/Servidor
Tape Drive, Autoloader,
Library
SCSI, Fibra Óptica ou
ISCSI
Servidor
Object
Catalog
GUI
Lan ou Wan sobre TCP/IP
Clientes
Figura 15 – Arquitectura Cliente/Servidor.
Suportam qualquer drive tape SCSI, desde uma simples drive de tape até à
maior tape library. Também é possível fazer backups para discos ou
comunicar através de FC ou iSCSI a outros dispositivos de backup.
Projecto - Computadores e Sistemas
88
Ferramentas de gestão e manutenção de backups
Suportam tape libraries e permitem que o servidor de backup seja capaz
de gerir muitas drives em simultâneo, cada uma delas recebendo os dados
para as tapes.
Permitem operações de restore concorrentes. Esta capacidade optimiza o
uso de bibliotecas de armazenamento com múltiplas drives. A cada drive
que não esteja a ser usada é automaticamente atribuída uma nova tarefa.
É possível correr simultaneamente tarefas de backup e restore.
Implementam tecnologia de multiflow que permite assim ao servidor iniciar
processamento paralelo para gerir clientes simultaneamente. Desta forma,
é garantido o load balancing entre as máquinas mais rápidas e mais lentas.
Esta característica assegura continuidade na rede enquanto providencia
backups estáveis e rápidos.
O processamento paralelo também é implementado do lado do cliente. Esta
característica utiliza a capacidade e velocidade dos servidores modernos.
De forma a salvaguardar a largura de banda da rede, utilizam algoritmos
de compressão para optimizar o tamanho dos dados transmitidos do cliente
até ao servidor.
Assistentes incorporados simplificam as operações mais comuns, fazendo
com que sejam ferramentas fáceis de usar mesmo por utilizadores com
pouca preparação técnica, sendo, no entanto, suficientemente poderosa
para os utilizadores mais avançados.
Usam mecanismos que processam e monitorizam todas as operações de
backup e restore e fazem a actualização da informação sobre a actividade
numa base de dados.
A informação da base de dados inclui:
o Ficheiros, directorias, drives e máquinas às quais tenha sido feito um
backup ou uma cópia;
o Tipos de trabalhos, resultados finais, hora de início e de conclusão
dos trabalhos processados;
o Dispositivos utilizados, tal como o tipo, o nome, a data da primeira
formatação, a data em que termina e as sessões armazenadas no
dispositivo.
Dando resposta à grande heterogeneidade de servidores que constituem os
sistemas informáticos, existe software para quase todos os sistemas
existentes, sejam eles NT, Unix, NetWare, etc.
Projecto - Computadores e Sistemas
89
BrightStor
Enterprise
Backups
Ferramentas de gestão e manutenção de backups
BrightStor Enterprise Backup
A Computer Associates International, INC (C.A), criou o BrightStor
Enterprise Backup. Uma solução de backup e restore de dados
multiplataforma (Windows e Unix).
Esta ferramenta suporta várias plataformas, aplicações, bases de dados e
sistemas de armazenamento, incluindo NAS e SAN, em ambientes
Windows NT/2000 e Unix. Apresenta um interface gráfico intuitivo e uma
arquitectura de domínios multiplataforma, o que facilita o trabalho dos
administradores na implementação de políticas de backup em ambientes
complexos e heterogéneos.
É uma solução de alta gama e escalabilidade ilimitada, indicada para
médias ou grandes empresas.
Permite realizar backups de 1,2 terabytes por hora em bases de dados
online Microsoft SQL Server 2000 e de 1,5 terabytes de dados por hora
em ambientes UNIX, o que a torna a solução mais rápida do mercado.
BrightStor Enterprise Backup não só automatiza a área da protecção de
dados como ajuda os administradores na gestão dos ambientes de
armazenamento, a partir de uma consola central. Conta ainda com
funções avançadas como gestão de redes SAN, operações serverless (sem
servidor), etc.
Familia BrightStor
Gama completa de soluções:
BrightStor Enterprise Backup para NT/2000/Unix
BrightStor ARCserve Backup 2000 para NT/2000
BrightStor ARCserve Backup 2000 para NetWare
BrightStor ARCserve Backup 2000 para Linux
BrightStor Mobile Backup (Protecção de dados portáteis,
PC's remotos)
o BrightStor ARCserve Backup for Small Business Server
o BrightStor Storage Resource Manager (Gestão de recursos
de armazenamento)
o BrightStor High Availability Manager (Replicação de dados)
o
o
o
o
o
Projecto - Computadores e Sistemas
91
Ferramentas de gestão e manutenção de backups
Principais características
O BrightStor Enterprise Backup permite aos administradores controlarem
todas tarefas de protecção de dados. A arquitectura de administração
ajuda a configurar e gerir a segurança do sistema e a administrar políticas
coerentes para toda a empresa desde uma única consola.
O BrightStor Enterprise Backup oferece agentes de cópia de segurança
sobre praticamente todas as plataformas: Windows NT/2000, todos os
derivados principais de UNIX (Solaris, HP-UX, TRU 64, SGI IRIX e SCO
UNIXWare), Netware, as principais distribuições de Linux (Red Hat, SuSE,
Caldera, TurboLinux e Debian), AS 400 e Open VMS. Conta com um agente
para arquivos abertos - Open File Agent.
Possui uma enorme gama de módulos complementares, incluindo os
agentes de cópia de segurança e recuperação que distinguem as aplicações
para Oracle, Microsoft SQL, Microsoft Exchange, Lotus Notes, SAP R/3,
Sybase e Informix.
Em caso de um desastre, o BrightStor Enterprise Backup indica as tapes
adequadas de forma a que os dados possam ser restaurados em tempo
mínimo.
Requisitos mínimos do sistema
Sistema Operativo:
o
o
o
o
o
o
Microsoft Windows NT v4.0 ou superior;
Windows 2000 Server, Windows 2000 Advanced Server;
Solaris SPARC 2.7 and 2.8;
HP-UX 11.0;
AIX 4.3.2, 4.3.3 e 5L;
TRU64 4.0e, 4.0f, 5.0 e 5.1;
Processador:
o 350 MHz ou superior;
Memória:
o Necessária: 128 MB RAM (Servidor);
o Recomendada: 256 MB RAM (Servidor);
Espaço em disco:
o 350 Mb livre em disco;
Projecto - Computadores e Sistemas
92
Ferramentas de gestão e manutenção de backups
Backup
Exec
Projecto - Computadores e Sistemas
93
Ferramentas de gestão e manutenção de backups
Veritas Backup Exec
A família Backup Exec oferece uma completa solução de backup para
grupos de trabalho em plataformas mistas que necessitem de protecção
para ambientes Windows NT/2000 e Novell NetWare. A Backup Exec Family
possibilita uma solução escalável para redes de qualquer tamanho e
utilizadores de qualquer nível. O VERITAS Backup Exec está disponível nas
seguintes edições:
o VERITAS Backup Exec for Windows NT and Windows
2000 Server Edition
o VERITAS Backup Exec for Windows NT and Windows
2000 Advanced Server Edition
o VERITAS Backup Exec for Windows NT and Windows
2000 Small Business Server Edition
o VERITAS Backup Exec for Netware
O VERITAS Backup Exec foi a primeira solução de armazenamento de
dados certificada para o sistema operativo Windows NT e Windows 2000.
Actualmente na sua sétima geração, o Backup Exec é uma solução de cópia
de segurança para redes, com elevado desempenho, fácil utilização e
grande flexibilidade, que protege actualmente milhões de servidores
Windows NT e Windows 2000 em todo o mundo.
Um assistente exclusivo do Backup Exec simplifica o arranque, a
configuração do sistema, a programação de trabalhos e outras tarefas de
rotina.
Possui uma grande variedade de opções e agentes disponíveis, que permite
uma expansão para suportar a mudança constante das redes e
configurações.
Disponibiliza um vasto conjunto de ferramentas com inúmeras funções
para cópia de segurança e recuperação de dados, mantendo
simultaneamente um interface de fácil utilização.
Uma abrangente oferta de agentes e opções para a protecção online de
bases de dados e aplicações para a internet, gestão centralizada de
Projecto - Computadores e Sistemas
94
Ferramentas de gestão e manutenção de backups
diversos servidores de cópia de segurança, recuperação de desastres e
redes de área de armazenamento (SANs), etc.
O interface do Backup Exec é semelhante ao do Microsoft Explorer, é muito
familiar e fácil de utilizar. Este interface permite que os utilizadores tirem
todo o partido de caixas de diálogo, folhas de propriedades, sugestões de
ferramentas e menus sensíveis ao contexto, seleccionados pelo botão
direito do rato.
Principais características
Características
Benefícios
Compatibilidade com Windows NT e Windows 2000
As aplicações certificadas para
Windows 2000 reduzem o custo e o
Certificado pela Microsoft para
Windows 2000 Server, Advanced tempo da instalação e garantem
Server e Datacenter
uma maior compatibilidade e
fiabilidade.
O Backup Exec anuncia a sua
presença
através
do
Active
Directory, permitindo um controlo
Integração com o Active Directory
administrativo e seguimento de cada
servidor existente no domínio
Windows 2000.
Envia
informações
sobre
o
desempenho e traps de SNMP a
Integração com Windows
Management Instrumentation
qualquer estrutura suportada por
WMI ou consola de gestão.
Suporta FAT 16/32, VFAT, NTFS,
Suporte completo para o
CDFS e UDF incluindo sistemas de
Sistema de Ficheiros do
ficheiros do Macintosh e POSIX para
Windows NT e Windows 2000
uma flexibilidade máxima.
Protege todas as informações do
Estado do Sistema para
sistema operativo para preservar o
Windows NT Registry e
servidor local ou estação remota e
Windows 2000
as configurações dos servidores que
utilizem a tecnologia do Agente
Acelerador.
Proporciona
funções
de
transferência em caso de avaria em
Microsoft Cluster Server
cascata para ambientes com clusters
Support (MSCS)
multimodo e protege aplicações em
execução em modo activo-activo
Projecto - Computadores e Sistemas
95
Ferramentas de gestão e manutenção de backups
Flexibilidade e facilidade de utilização
O ExecView utiliza uma consola Java
para centralizar a monitorização da
Monitorização em Toda a
actividade dos trabalhos de cópia de
Plataforma baseada no
segurança em diversos Backup Exec
para Windows NT, Windows 2000
Browser da Web
e/ou Backup Exec para servidores
de NetWare.
Cópia de segurança através de Reduz o tráfego na LAN isolando o
uma Rede de Cópia de
tráfego de cópia de segurança numa
Segurança Especificada
sub-rede.
Automatiza a criação/programação,
Operações totalmente
gestão de suportes para preparação
baseadas em Assistentes
de desastres e recuperação.
Executa uma cópia de segurança
completa do sistema local fazendo
Cópia de Segurança premindo
clique num único ícone; proporciona
um único botão na Consola do
uma protecção do sistema rápida
Assistente do Backup Exec
sem ter de definir um trabalho de
cópia de segurança.
Inicia uma cópia de segurança a
Integração do Explorer do
partir da consola do Windows
Microsoft Windows
Explorer do servidor de cópia de
segurança, fazendo clique no botão
direito do rato do recurso.
Flexibilidade para executar a maior
Interface para Scripting na
parte das funções suportadas pelo
Linha de Comando
interface gráfico de utilizador.
Inicia programas definidos pelo
Suporte para pré e pós
utilizador antes e/ou depois da
comando
reposição das cópias de segurança.
Os relatórios integrados fornecem
informações valiosas sobre o estado
Relatórios Integrados
dos trabalhos e dos suportes de
dados.
Fiabilidade garantida
Transferência em caso de falha do
Integração com o VERITAS
servidor de cópia de segurança num
Cluster Server (VCS)
ambiente Cluster de Servidores
VERITAS.
Visualização fácil da programação de
Calendário de Planeamento e trabalhos e da gestão de operações
Planeamento de Feriados
de cópia de segurança 24x7,
Integrado
permitindo também excluir os
feriados do planeamento.
Repetição de trabalhos
Volta a tentar os trabalhos que
falhados
tenham falhado e redirecciona-os
Projecto - Computadores e Sistemas
96
Ferramentas de gestão e manutenção de backups
Notificações de Alerta
Automatizadas e Suporte para
SNMP
Pesquisa e limpeza de vírus
para unidades alternativas.
Notificação da consola através do
Microsoft Exchange, Lotus Notes ou
correio electrónico de SMTP, pager,
impressora, difusão através da rede
e aplicações de monitorização da
rede.
Garante que os dados estão livres
de vírus antes de fazer a cópia de
segurança; inclui a actualização da
assinatura "livre de vírus".
Garante a fiabilidade dos dados com
uma verificação rápida dos dados.
Operações de Verificação de
CRC e de Consistência da Base
de Dados
Advanced Device and Media Management(ADAMM)
Cópias de segurança e reposições
mais rápidas utilizando discos,
Cópia de segurança para disco incluindo discos rígidos, dispositivos
NAS e sistemas RAID com suportes
de armazenamento.
Retensão automática das tapes
Suporte para retensão de tapes
magnéticas
para
uma
maior
fiabilidade dos dados.
Maximiza o desempenho das cópias
Agrupamento de Dispositivos,
de segurança/reposição e facilita a
Operação em cascata e
transferência de tarefas em caso de
Equilíbrio Dinâmico das Cargas
falha.
Maior facilidade de definição dos
suportes de dados, etiquetagem,
Gestão Automática dos
seguimento, rotação, definição de
Suportes de Dados
períodos de retenção e visualização
de catálogos.
Gestão automatizada de dispositivos
Modo de Cópia de Segurança
e suportes para autoloaders com
com Administração Reduzida
uma única unidade - ideal para uma
(Low Administrative Backup
administração reduzida e ambientes
Mode - LABM)
de pequenas empresas.
Automatização de Ficheiros de Liberta o espaço em disco ocupado
Registos e Tratamento de
por ficheiros inactivos.
Discos/Catálogos
Dirige os trabalhos de cópia de
segurança para slots específicos
num autoloader de bandas ou
Partição de Slots de
biblioteca; mistura tipos de unidades
Autoloader/Biblioteca
numa biblioteca de bandas.
Projecto - Computadores e Sistemas
97
Ferramentas de gestão e manutenção de backups
Desempenho
Detecta dispositivos NAS para
Suporte para Network
Windows NT e Windows 2000 de
Attached Storage (NAS)
outros fornecedores e incorpora-os
em rotinas de protecção diárias.
Permite a protecção remota de
servidores
e
aumenta
Exclusive Agent Accelerator
dramaticamente a velocidade das
TechnologyTM
cópias de segurança na LAN com
um
processamento
distribuído,
compressão de ficheiros e o sistema
de cliente remoto.
Utiliza as capacidades de cópias
Diversos Métodos de Cópia de completas, diárias, incrementais,
Segurança
diferenciais e de trabalho para uma
maior flexibilidade.
Acesso Rápido a Ficheiros (Fast Mais rápido acesso aos dados com
File Access-FFA)
pesquisa dos ficheiros a alta
velocidade no hardware suportado.
Mantém uma lista de todas as
Apresentação da Versão dos
versões dos ficheiros guardados em
Ficheiros
tape para simplificar a sua
localização.
Fornece informações de localização
Catálogo Baseado em
a pedido para um mais rápido
Discos/Bandas
acesso aos ficheiros e a todo o
catálogo.
Requisitos Mínimos do sistema
Sistema Operativo:
o Microsoft Windows NT Small Business Server v4.5 e Microsoft
Windows NT Small Business Server 2000
o Microsoft Windows NT Workstation v4.0 ou Microsoft Windows NT
Server Operating System v4.0; Service Pack 4 ou posterior
o Windows 2000 Prefessional, Windows 2000 Server, Windows 2000
Advanced Server ou Windows 2000 Datacenter Server
Processador:
o X86 Intel ou compatível, DEC Alpha system* (Alpha suportado
apenas no Windows NT 4.0)
Projecto - Computadores e Sistemas
98
Ferramentas de gestão e manutenção de backups
Memória:
o Necessária: 128 MB RAM (Servidor);
o Recomendada: 256 MB RAM (Servidor);
Espaço em Disco:
o 45 MB de espaço em disco rígido após a instalação do Microsoft
Windows NT e Windows 2000 (instalação típica).
* Não aplicável com Intelligent Disaster Recovery, Agente para Oracle Server, Agente para
SAP R/3, Opção IBM ADSN, Agente para Base de Dados Lotus Domino, QIC 113 Tape
Read.
Projecto - Computadores e Sistemas
99
Arkeia 5
Ferramentas de gestão e manutenção de backups
Arkeia 5
Não tão popular como os dois anteriores, não deixa de ser um solução a
ter em conta Utiliza um interface amigável e intuitivo baseado em
XWindows, mas também é possível fazer a gestão através da linha de
comandos. O servidor pode ser gerido remotamente através de qualquer
computador na rede via TCP/IP.
O Arkeia suporta uma enorme classe de clientes (mais de 60) com
diferentes sistemas, desde o Linux, os mais populares sistemas Unix, todos
Windows, quer sejam workstations ou servidores, Novell, e alguns sistemas
menos conhecidos. Como servidor esta versão apenas suporta alguns
sistemas Unix e Linux, não suportando qualquer tipo de Windows.
A arquitectura do Arkeia suporta vários ambientes profissionais desde o
pequeno negócio até uma grande empresa com uma larga rede
heterogénea.
É capaz de gerir um largo número de drives de tape, tais como, DAT, DLT,
Ecrix, Sony e LTO, assim como as tape libraries da Ecrix, Exabyte,
Quantum, HP, Overland, StorageTek, etc.
Principais Características
Implementa tecnologia multiflow que permite assim ao servidor iniciar
processamento paralelo para gerir até 200 clientes simultaneamente. Desta
forma, é garantido o load balancing entre as máquinas mais rápidas e mais
lentas. Esta característica assegura continuidade na rede enquanto
providencia backups estáveis e rápidos.
O processamento paralelo também é implementado do lado do cliente, esta
característica utiliza a capacidade e velocidade dos servidores modernos
que guardam enormes bases de dados.
O Arkeia permite operações concorrentes de backup/restore, esta
capacidade optimiza a utilização de tape libraries com múltiplas drives de
tape.
Ao nível da segurança o Arkeia garante uma óptima prestação a todos os
níveis, desde o servidor até aos clientes. No servidor de backup providencia
redundância, sistemática autenticação dos utilizadores, logs dos backups e
dos restores de dados. Nos clientes faz encriptação os ficheiros enquanto
faz o backup, antes de estes viajarem pela rede até ao servidor, garantindo
Projecto - Computadores e Sistemas
101
Ferramentas de gestão e manutenção de backups
confidencialidade dos dados. Permite automaticamente o reinicio do
processo de backup ou restore, em caso de falha de comunicação entre o
servidor e o cliente, na fase onde tinha existido a falha.
De forma a salvaguardar a largura de banda da rede, o motor de
transações do Arkeia utiliza algoritmos de compressão para optimizar o
tamanho dos dados transmitidos do cliente até ao servidor.
Ao nível das tape libraries, o servidor de backup é capaz de gerir até 32
drives em simultâneo, cada uma delas recebendo os dados para as tapes.
A gestão do Arkeia permite operações de restore concorrentes. Esta
capacidade optimiza o uso de tape libraries de armazenamento com
múltiplas drives. A cada drive que não esteja a ser usada é
automaticamente atribuída uma nova tarefa. O Arkeia pode correr
simultaneamente tarefas de backup e restore. Esta combinação de
tecnologia permite ao Arkeia realizar velocidades de backup mais do que
70 GB/h em redes Ethernet 100BT e mais de 700GB/h em redes a Gigabit,
por servidor.
Disponível só nesta versão, a tecnologia que permite a partilha de tape
libraries, é uma forma eficiente de consolidar este tipo de dispositivos em
ambientes empresariais. Esta tecnologia permite que vários servidores
Arkeia se possam ligar a uma tape library via SCSI.
Algumas opções adicionais:
o Backup e restore para base de dados ( MySql, PostGreSql,Oracle,
etc.).
o Disaster Recovery de máquinas;
o Backup e restore de aplicações (Apache, MS Exchange, SAP,
PeopleSoft, Lotus Notes, etc.).
o Encriptação avançada para melhor protecção dos dados(AES,
Twofish, etc.).
o Hot Plug-ins para permitir o backup e o restore de uma aplicação
enquanto estão em uso.
Projecto - Computadores e Sistemas
102
Ferramentas de gestão e manutenção de backups
Requisitos Mínimos do sistema
Lista de sistemas onde é possível instalar o Arkeia:
Sistema Operativo
Servidor Cliente
AIX 3.2
AIX 4.x
BSDi 3.0, 4.0
DGUX AviiON
DRSNX 7 (ICL, Intel x86)
DRSNX 7 (ICL, Sparc)
FreeBSD 2.2.6 (Intel x86)
FreeBSD 3.2 (Intel x86)
HP-UX 9
HP-UX 10
HP-UX 11
IRIX 4
IRIX 5.3
IRIX 6.x
Linux 2.x (Intel x86)
Linux 2.x (MIPS, Cobalt)
Linux 2.x (Alpha)
Linux 2.x (ARM, Netwinder)
MaxOS 4.2 (MIPS)
MaxOS 4.2(PowerPC)
Novell Netware 4.11 (Intel
x86)
DEC Alpha UNIX 3.2
SCO v5 (Intel x86)
Solaris 2.5, 2.6 (Intel x86)
Solaris 2.5, 2.6 (Sparc)
SunOS 4.1
Compaq Tru64
Unixware 2.x
Windows 95/98/ME
Windows NT Server 4.0
(Alpha)
Windows NT Server 4.0 (Intel
x86)
Windows NT Workstation 4.0
(Intel x86)
Windows 2000
Windows XP
Projecto - Computadores e Sistemas
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
103
Ferramentas de gestão e manutenção de backups
Memória:
o Necessária: 128 MB RAM (Servidor), 64 MB RAM (Cliente)
o Recomendada: 256 MB RAM (Servidor), 128 MB RAM (Cliente)
Projecto - Computadores e Sistemas
104
Capítulo
7
Conclusão
Conclusão
Conclusão
É muito fácil, especialmente nos tempos que correm, ser tentado a
implementar qualquer tipo de DR. Mas é necessário ter algumas
precauções e saber o que é realmente necessário para que a empresa
continue a funcionar.
Em seguida, devemos pensar na forma de fazer backup e de recuperar
essa informação. Hoje em dia, existe, tecnologia para dar resposta a todas
as necessidades.
Infelizmente, não existe uma resposta tipo receita médica para planear
uma estratégia de backup. Toda e qualquer estratégia fica dependente de
muitos factores, alguns que não é possível sequer dominar. Com a
elaboração deste trabalho espero ter conseguido mostrar muitos desses
factores que condicionam fortemente qualquer estratégia, e que este
trabalho possa servir de consulta para quem quer saber mais sobre este
assunto.
Sobre os sistemas de software escolhi apresentar de uma forma resumida
apenas três, mas existem muitos mais no mercado que implementam mais
ou menos as mesmas funções. Este é um mercado que também evoluiu
muito nos últimos anos e que tornou os softwares estes cada vez mais
completos, dando resposta a quase todas as necessidades existentes.
Projecto - Computadores e Sistemas
106
Capítulo
8
Anexos
Anexo - 1
Suportes para
backups
Suporte em Tape
As drives de tape são construídas exclusivamente para funções de backup.
Estes dispositivos armazenam muitos gigabytes de dados por tape e tapes
adicionais são relativamente económicas. Os dispositivos modernos de
backup em tape oferecem excelente produtividade operacional, o que faz
deles a primeira escolha, tanto para o servidor como para o backup de
rede. As drives de tape, são uma boa opção para dispositivos de backup
quando é necessário fazer o backup a grandes quantidades de dados.
8 mm
As drives de 8 mm oferecem uma velocidade moderada e boas capacidades
em ambientes de tamanho médio. As capacidades variam de 2.5 a 40 GB,
com taxas de transferência de 60 a 80 MB por minuto.
ADR (Advanced Digital Recording)
As drives ADR fornecem uma solução de alta velocidade para
computadores de secretária e servidores individuais. Com taxas de
transferência de 30MB até 120MB por minuto e capacidades superiores a
50GB, o ADR permite aos utilizadores um backup mais rápido e com uma
capacidade maior.
AIT (Advanced Intelligent Tape)
O AIT é apropriado para ambientes que exijam uma grande capacidade e
uma grande performance. Cada tape pode levar mais de 50GB. As drives
AIT podem transferir dados a mais de 360MB por minuto.
DAT (Digital Audio Tape)
Cada tape DAT compactada, pode suportar cerca de 12GB (DDS-3), 20GB
(DDS-4) ou mais, dependendo da facilidade com que os dados estão
comprimidos. A velocidade pode variar de 6MB até 150MB por minuto.
DLT (Digital Linear Tape)
Os DLT são tapes finais que possuem grandes capacidades e taxas rápidas
de transferência. Utilizam tapes de meia polegada em tamanhos que
variam dos 10 aos 110GB. Com um computador rápido e ficheiros grandes,
os DLT atingem taxas de transferência de mais de 600MB por minuto.
SDLT (Super Digital Linear Tape)
Uma evolução das DLT com maior e melhor performance. Capacidade para
armazenar até 220 GB e uma taxa de transferencia de 79,2 GB/h.
LTO (Linear Tape Open)
Os dispositivos Linear Tape Open são um dos drives disponíveis com maior
capacidade e maior velocidade. Os drives do formato Ultrium podem
armazenar mais de 100GB com velocidades superiores a 20MB por
segundo.
Mammoth
As drives de tape Mammoth, baseadas num formato AME (Advanced Metal
Evaporative), são rápidas e são uma excelente escolha para necessidades
de backup de baixo ou médio nível. Armazenam 60GB por tape e oferecem
taxas de transferência que excedem os 16MB por segundo.
Travan/QIC (Quarter-Inch Cartridge)
As drives Travan/QIC são relativamente baratas e têm grandes
capacidades para pequenos negócios ou ambientes de negócio doméstico
com certas necessidades. Estas drives podem suportar de 4 a 50GB em
cada tape e a velocidade varia dos 30 aos 300MB por minuto
respectivamente. Algumas drives Travan/QIC oferecem compressão de
software, outras não.
VXA
As drives VXA oferecem uma nova tecnologia de tapes fidedigna e que é
relativamente barata para ambientes pequenos ou de tamanho médio. O
VXA formata os dados em pequenos volumes, opera a velocidade variável e
consegue ler múltiplos tempos de dados numa única passagem de tape.
Com capacidades que variam dos 20 aos 66GB e com velocidades
superiores a 360MB por minuto, a drive VXA-1 oferece uma grande
flexibilidade a um preço efectivo.
Autoloaders e Tape Libraries
As Tape Libraries são ideais para backups inesperados, particularmente em
redes de computadores e permitem uma grande flexibilidade. Uma tape
library consiste num dispositivo de armazenamento de dados, constituído
por uma ou mais drives de tape e por um ou mais braços robóticos que
automaticamente movem as tapes entre o “armazém” e as drives de tape.
Estão disponíveis com drives de quase todos os formatos de tape. A
velocidade e capacidade dependem do tipo da drive instalada e do número
de tapes disponíveis.
Suportes Multi-uso
Exceptuando as drives de tape, a maior parte dos dispositivos de
armazenamento podem ser utilizados para outros propósitos que não têm a
ver com backup e arquivo. Enquanto estes dispositivos variam muito no
custo de armazenamento por gigabyte, a sua grande quantidade de
funções faz com que sejam muito atractivos, já que repartem os custos por
diferentes utilizações.
CD-R e CD-RW (Compact Disc Recordable and Rewritable)
As drives CD-R e CD-RW armazenam dados em compact discs especiais e
permitem uma solução prática e com custos efectivos para necessidades
modestas. As drives CD-R e CD-RW armazenam 1.2GB em cada disco. A
velocidade das drives CD-R e CD-RW varia e pode ir de 5 a 50MB por
minuto.
DVD-RAM (Writable Digital Versatile Disc)
Estes discos DVD são a mais recente tecnologia de armazenamento. Cada
unidade DVD-RAM pode suportar 4.7GB em cada lado, num total de 9.4GB
a uma velocidade superior a 60MB por minuto.
Discos
O grande crescimento da capacidade de armazenamento em discos e a sua
descida de preço fizeram com que se tornasse atractivo para uso de
backup. Contudo, é importante ter em mente que a natureza do disco fixo
não promove necessariamente portabilidade e armazenamento off-site, o
qual é vital para qualquer estratégia de backup completo. Esta categoria
também pode incluir dispositivos Network-Attached Storage (NAS),
acessíveis ao software de backup.
MO (Magneto–Optical)
As drives MO permitem acesso instantâneo a grandes quantidades de
informação e os discos ópticos não são susceptíveis de partir as cabeças ou
provocar desgaste na fita magnética. A tecnologia MO permite reescrita,
fazendo dela uma boa escolha para backup e útil como um meio de grande
capacidade e performance, para substituir as disquetes de 3.5’’. Ao utilizar
tanto cabeças lazer como magnéticas estas drives tanto suportam as
disquetes 3.5’’, para uma capacidade superior a 1.3 GB como as de 5.25’’
para uma capacidade superior a 5.2 GB, a velocidades de 60 a 120 MB por
minuto.
Dispositivos amovíveis de tapes
As drives SuperDisk, Zip, Jaz e Orb são ideais para backups pessoais, já
que transferem os ficheiros entre computadores ou armazenam ficheiros
não necessários. As capacidades podem variar de 100 MB até 2.5 GB com
velocidades que vão dos 30 aos 480 MB por minuto.
Anexo - 2
Alguns dispositivos de
armazenamento
Fornecedor: StorageTek
Categoria: Biblioteca;
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A Biblioteca StorageTek L40 proporciona uma maior performance e uma
maior capacidade de gestão de dados em ambientes distribuídos. A
combinação de tecnologia comprovada, segurança, alta velocidade robótica
e um preço de lançamento acessível, mais a capacidade de poder crescer
sem limites através de um fácil upgrade da L20 para a L80, tornam a
biblioteca L40 a resposta para as necessidades de backups automáticos e
de recuperação criadas pelo crescimento organizacional.
Principais benefícios:
-
suporta diversos sistemas operativos
facilidade de fazer upgrade
líder em armazenamento
fácil utilização
eficiência volumétrica
protecção ao investimento
Características técnicas:
Número de cartuchos: 20, 40
Número de drives: 1 a 4
Tipo de drive: DLT1; DLT7000/8000; SuperDLT; LTO Ultrium
Capacidade: 700 GB a 4.4 TB sem compressão, dependendo da drive
Interfaces: SCSI LVD/SE, HVD e Fibre Channel
Throughput por hora: 22 GB a 216 GB sem compressão, dependendo da
drive
Leitor de código de barras: Sistema de leitura feito através de uma câmara
digital
Dimensões L40: 19.0’’ x 17.5’’ x 29.75’’
(48.3cm x 44.5cm x 75.6cm)
Fornecedor: StorageTek
Categoria: Biblioteca;
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A maioria dos ambientes distribuídos adequa-se à elevada capacidade
apresentada pela Biblioteca StorageTek L80 pois fornece capacidades
avançadas, elevada performance e uma gestão dinâmica de dados. Com
uma tecnologia de nível internacional, robótica extremamente rápida e o
dobro da segurança relativamente aos concorrentes, a Biblioteca
StorageTek L80 é a última solução para necessidades de backups
automáticos e de recuperação criadas pelo crescimento organizacional. A
unidade L80 é associada ao conceito único de menor espaço físico, em vez
de soluções da concorrência baseada em unidades empilhadas em
prateleiras.
Principais benefícios:
-
suporta diversos sistemas operativos
facilidade de fazer upgrade
líder em armazenamento
fácil de utilizar
é a mais segura da gama
disponibilidade contínua
volumetricamente eficiente
protecção ao investimento
Características técnicas:
Número de cartuchos: 40, 60, 80
Número de drives: 1 a 8
Tipo de drive: DLT1; DLT7000/8000; SuperDLT; LTO Ultrium
Capacidade: 1.4 TB a 8.8 TB sem compressão, dependendo da drive
Interfaces: SCSI LVD/SE, HVD e Fibre Channel
Throughput por hora: 143.2 GB a 432 GB sem compressão, dependendo da
drive
Leitor de código de barras: Sistema de leitura feito através de uma câmara
digital
Dimensões L80:
19.0’’ x 31.5’’ x 29.0’’
(48.3cm x 80cm x 73.7cm)
Fornecedor: StorageTek
Categoria: Biblioteca de Tapes;
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A Biblioteca StorageTek L180 foi desenhada para
ambientes UNIX e Windows NT de média gama. A alta
velocidade disponível na interface Fibre Channel, em conjunto com a drive
Fibre Channel StorageTek 9840, tornam-na ideal para a ligação escalonável
de Storage Area Networks (SANs).
Principais benefícios: - integra diferentes tecnologias de unidades de
armazenamento (drive) para uma maior escalabilidade no fluxo de dados a
armazenar
- partilha/gestão até grandes distâncias
- administração simplificada e centralizada
- funcionamento contínuo
- componentes de rede localizados
- velocidade de troca mais elevada
Características técnicas:
Número de cartuchos: 84, 140, 174
Número de drives: até 6 drives 9840; até 10 drives DLT8000/SDLT ou LTO
Ultrium
Tipo de drive: 9840, DLT8000/SDLT, LTO Ultrium
Capacidade: 9840 – 1.68 TB a 3.48 TB DLT8000 – 3.36 TB a 6.96 TB SDLT
– 9.24 TB a 19.14 TB LTO Ultrium – 8.4 TB a 17.4 TB
Interfaces: SCSI, Fibre Channel nativo
Throughput por hora: 9840 – até 216 GB DLT8000 – até 216 GB SDLT –
até 396 GB LTO Ultrium – até 540 GB
Leitor de código de barras: Sistema de leitura feito através de câmara
digital.
Dimensões L180:
28.3’’ x 65.1’’ x 49.3’’
(71.9cm x 165.4cm x 125.2cm)
Fornecedor: StorageTek
Categoria: Biblioteca de Tapes;
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A Biblioteca StorageTek L20 é a primeira da nova série de bibliotecas de
tapes L20/ L40/ L80 que permite total protecção e gestão dos dados dos
ambientes distribuídos NT, Novell, Linux, e UNIX.
Principais benefícios:
-
fácil utilização
protecção de dados
fácil administração e gestão
mais controlo por menos dinheiro
mais fácil para fazer upgrade
plataforma flexível
fácil upgrade para Fibre Channel
Características técnicas:
Número de cartuchos: 10, 20
Número de drives: 1 a 2
Tipo de drive: DLT1; DLT7000/8000; SuperDLT; LTO Ultrium
Capacidade: 350 GB a 2.2 TB sem compressão dependendo da drive
Interfaces: SCSI LVD/SE, HVD e Fibre Channel
Throughput por hora: 11GB a 108 GB sem compressão dependendo da
drive
Leitor de código de barras: Sistema de leitura feito através de uma câmara
digital
Dimensões L20
19.0’’ x 7.0’’ x 27.5’’
(48.3cm x 17.8cm x 71.1cm)
Fornecedor: StorageTek
Categoria: Biblioteca de Tapes;
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A Biblioteca StorageTek L700 foi desenhada para grandes sistemas abertos
distribuídos e para ser implementada em ambientes UNIX e Windows NT. A
alta velocidade disponível na interface Fibre Channel, conjuntamente com
as drives Fibre Channel StorageTek 9840 e T9940, tornam-na ideal para a
ligação escalonável de Storage Area Networks (SANs).
Principais benefícios:
- integra diferentes tecnologias de unidades de armazenamento (drive)
para uma maior escalabilidade no fluxo de dados a armazenar
- partilha/gestão até grandes distâncias
- administração simplificada e centralizada
- funcionamento contínuo
- componentes de rede localizados
- velocidade de troca mais elevada
Características técnicas:
Número de cartuchos: 216, 384, 678
Número de drives: até 12 para drives 9840 ou T9940; até 20 drives em
DLT8000/SDLT ou LTO Ultrium
Tipo de drive: 9840, T9940, DLT8000/SDLT, LTO Ultrium
Capacidade: 9840 – 4.32 TB a 13.56 TB T9940 – 12.96 TB a 40.68 TB
DLT8000 – 8.64 TB a 27.12 TB SDLT – 23.76 TB a 74.56 TB LTO Ultrium –
21.6 TB a 67.8 TB
Interfaces: SCSI, Fibre Channel native
Throughput por hora: 9840 – até 432 GB T9940 – até 432 GB DLT8000 –
até 432 GB SDLT – até 792 GB LTO Ultrium – até 1.08 TB
Leitor de código de barras: Sistema de leitura feito através de uma câmara
digital
Dimensões L700:
61.3’’ x 72.0’’ x 37.5’’
(155.7cm x 184.6cm x 95.3cm)
Fornecedor: StorageTek
Categoria: Biblioteca de Tapes;
Armazenamento
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A Biblioteca StorageTek 9310 (PowderHorn) é um sistema automático de
cartridge com grande capacidade de armazenamento e rapidez de acesso,
ideal para UNIX, grandes computadores e sistemas de mainframe.
Apropriada para partilhar informação abrangendo a totalidade da empresa,
o sistema automático de cartridge StorageTek 9310 é a biblioteca da
StorageTek que maior capacidade oferece.
Principais benefícios:
-
Armazena petabytes (mais de 1 milhão de GB) de informação
Acesso aos dados em segundos
Precisão de confiança
Balanceamento da carga de trabalho
Capacidade para novas aplicações
Dados precisos na altura exacta
Possibilidade de ligar múltiplas plataformas
Reduzida janela de backup
Características técnicas:
Número de cartuchos: Até 6,000/LSM
Número de drives: De 2 a 80
Tipo de drive: 9840, T9940 Capacidade (máxima): 9840 - 120 TB T9940 –
360 TB Interfaces: ESCON, SCSI Throughput por hora: 2.88 TB Leitor de
código de barras: Sistema digital de visão standard
Dimensões* 9310:
92.5’’ x 128.0’’
(234.9cm x 325.0cm)
* através de cada prateleira e paredes
Fornecedor: StorageTek
Categoria: Biblioteca de Tapes; UNIX
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A Biblioteca StorageTek 9740 (TimberWolf)
adequada para sistemas UNIX, manipula o complexo
armazenamento de dados em ambientes de grande e
variada extensão. É ideal para aplicações de negócio complexas tais como
o comércio electrónico, armazenamento de dados, multimédia,
broadcasting, telecomunicações e representação médica/científica.
Principais benefícios:
- robótica rotativa avançada
- fácil integração
- elevada performance / elevada capacidade
- compacta
Características técnicas:
Número de cartuchos: 326, 494 (num só equipamento); Até 2,900 (com 6
equipamentos)
Número de drives: Um só equipamento: até dez drives 9840, T9940,
DLT8000 ou SDLT; Máximo: 60 drives (podem ser combinadas)
Tipo de drive: 9840, T9940, DLT8000/SDLT, LTO Ultrium
Capacidade: Um só equipamento: 9840 – 6.52 TB a 9.88 TB DLT8000 –
13.04 TB a 19.76 TB; SDLT – 35.86 TB a 54.34 TB; Máximo: 9840 – até
59.28 TB; DLT8000 – até 118.56 TB; SDLT – até 326.04 TB
Interfaces: SCSI
Throughput por hora: Um só equipamento: 9840 – até 360 GB; DLT8000 –
até 216 GB; SDLT – até 396 GB; Máximo: 9840 – 2.16 TB; DLT8000 – 1.30
TB; SDLT – 2.38 TB
Leitor de código de barras: Sistema de leitura feito através de uma câmara
digital
Dimensões 9740:
72.0’’ x 46.0’’ x 30.3’’
(183.0cm x 117.0cm x 77.0cm)
Fornecedor: StorageTek
Categoria: Tape Drive;
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A tape drive StorageTek 9840 oferece uma velocidade superior e um
incomparável acesso aos dados, juntamente com uma excelente
capacidade para aplicações críticas em tempo e intensivas em transacções.
Não tendo limitações de conectividade, pois suporta Ultra SCSI, ESCON e
Fibre Channel nativo (ideal para ligações SAN), a 9840 foi imaginada para
suportar ambientes de negócio que necessitem de manter um acesso
contínuo e económico no acesso a uma grande extensão de dados.
Principais benefícios:
- Back-up de mais dados em menos tempo
- Com automatização e AMT (Adaptive Media Technology) pode ser
combinada com um sistema de tapes de capacidade virtual permitindo
responder com precisão às necessidades dos objectivos de negócio do
Cliente
Características técnicas:
Tipo de drive: Cartridge de Meia polegada, 288-pistas
Estimativa de dados transferidos: 10 MB/sec (não comprimidos)
Capacidade: 20 GB (não comprimidos)
Tempo de carga da tape até estar pronta: 11 segundos
Interface: ESCON, SCSI, Fibre Channel
Compatibilidade de leitura/escrita: 9840
Biblioteca de ligação: 9310, L700; L180; 9740; 9738
Modos de emulação: 3490, 3590, 9840
Dimensões 9840:
3.25’’ x 5.75’’ x 15’’
(8.25cm x 14.6cm x 38.1cm)
Fornecedor: StorageTek
Categoria: Tape Drive;
Tipo de produto: Hardware
Finalidade: Armazenamento
Informação genérica:
A tape drive StorageTek T9940 oferece uma excelente capacidade de
armazenamento para aplicações de negócio tais como arquivo,
desenvolvimento, backup, gravação de registos e necessidades de disaster
recovery. A extrema segurança da T9940 oferece uma combinação de
capacidade superior, velocidade e robustez, num pacote económico e
compacto.
Principais benefícios:
- Uma capacidade por cartridge de 60 gigabyte
- 10 megabytes por segundo (até 37 megabytes comprimidos)
- Ligação heterogénea via ESCON, SCSI e Fibre Channel nativo
- A avançada engenharia dos componentes, e todo o conjunto, fornece o
melhor em robustez, segurança e disponibilidade de dados
Características técnicas:
Tipo de drive: Cartridge de Meia polegada, 288-pistas
Estimativa de dados transferidos: 10 MB/seg (não comprimido)
Capacidade: 60 GB (não comprimido)
Tempo de carga da tape até estar pronta: 18 seg
Interface: ESCON, SCSI, Fibre Channel
Compatibilidade de leitura/escrita: T9940
Biblioteca de ligação: 9310, L700
Modos de emulação: 9840, 3490, 3590
Dimensões T9940:
3.25’’ x 5.75’’ x 20.5’’
(8.25cm x 14.6cm x 52cm)
Glossário
Glossário
ATM (Asynchronous Transfer Mode) – protocolo de comunicação de
alta velocidade.
Agent – programa de computador ou processo que opera sobre uma
aplicação cliente ou servidor e realiza uma função específica.
Downtime – tempo de inactividade do sistema.
FC (Fiber Chanel) – Sistema de comunicação de alta velocidade (até 2
GB/seg.) utilizando FC.
Hot Swap – Capacidade de adicionar e remover dispositivos a um
computador enquanto este trabalhar e automaticamente sendo
reconhecido automáticamente.
LAN (Local Area Network) – Rede formada por computadores
localizados no mesmo espaço fisico.
Mainframe – Computador de grande porte.
SAN (Storage Area Network) - é uma rede de alta velocidade que
interliga dispositivos de armazenamento como de discos rígidos.
SCSI (Small Computer System Interface) – Dispositivo de interligação
de periféricos a grande velocidade (mais de 80 MB/seg.) a computadores.
SNMP (Simple Network Management Protocol) - Protocolo usado
para fazer monitorização e controlar os serviços e dispositivos de uma
rede TCP/IP.
WAN (Wide Area Network) – Rede composta por computadores que
estão localizados numa grande área, como cidade ou pais.
Projecto - Computadores e Sistemas
122
Bibliografia
Bibliografia
O esclarecimento de dúvidas foi feito através de documentação de apoio
disponibilizada pela empresa onde trabalho, de documentação encontrada
na internet, de elementos do departamento onde trabalho e pelo
orientador do projecto.
Alguns dos sites consultados:
http://www.sans.org
http://exabyte.com/
http://www.cai.com/
http://www.veritas.com/
http://www.arkeia.com/
http://www.dantz.com
http://www.tandberg.com
http://www.microsoft.com/technet
http://www.webopedia.com
http://www.legato.com
http://www.itpapers.com
Projecto - Computadores e Sistemas
123
Download

Ferramentas e Estratégias de Backup em Ambientes Heterogéneos