Backups Os backups tem dois objetivos principais: Permitir a recuperação de arquivos individuais Permitir a recuperação de sistemas de arquivo inteiros de uma só vez O primeiro objetivo é a base do típico pedido de recuperação de arquivo: um usuário apaga acidentalmente um arquivo e pede que seja recuperado pelo último backup. As circunstâncias exatas podem variar, mas este é o uso cotidiano mais comum para backups. A segunda situação é o pior pesadelo do administrador de sistemas: por alguma razão, o administrador de sistemas está mexendo no hardware que era uma parte produtiva do centro de dados. Agora, é algo mais do que um pedaço de aço e silicone. O que falta são todos os software e dados que você e seus usuários vem desenvolvendo ao longo dos anos. Supostamente, há backup de tudo. A questão é: há realmente este backup? E se houver, você é capaz de recuperá-lo? Dados Diferentes: Necessidades Diferentes de Backup Atente para os tipos de dados processados e armazenados por um sistema de computador típico. Note que alguns dados quase nunca mudam, e outros estão em mudança constante. A velocidade na qual os dados são alterados é crucial para desenvolver um procedimento de backup. Há duas razões para isso: Um backup nada mais é do que uma imagem instantânea dos dados sendo copiados. É um reflexo dos dados em um determinado momento. Dados que são alterados com pouca frequência podem ter backups com pouca frequência, enquanto dados com alterações frequentes devem ter backups mais frequentes. Os administradores de sistemas que têm um bom conhecimento de seus sistemas, usuários e aplicações devem ser capazes de agrupar os dados em categorias diferentes nos seus sistemas. No entanto, aqui estão alguns exemplos para que você possa começar: Sistema Operacional Estes dados são normalmente alterados somente durante atualizações (upgrades), instalações de consertos de erros (bug fixes) e quaisquer modificações específicas da empresa. Dica Você deve se importar com backups do sistema operacional? Esta é uma questão que muitos administradores de sistemas vêm ponderando ao longo dos anos. De um lado, se o processo de instalação é relativamente fácil, e se a aplicação de consertos de erros e personalizações são bem documentadas e de fácil reprodução, reinstalar o sistema operacional pode ser uma opção viável. Por outro lado, se há alguma dúvida que uma nova instalação pode recriar o ambiente do sistema operacional original, fazer backup do sistema operacional é a melhor opção, mesmo que os backups sejam feitos com menor frequência que os backups dos dados de produção. Backups ocasionais do sistema operacional também podem ser práticos quando apenas alguns arquivos do sistema precisarem ser restaurados (ex.: devido à remoção acidental de arquivos). Software da Aplicação Estes dados são alterados sempre que as aplicações são instaladas, atualizadas ou removidas. Dados das Aplicações Estes dados são alterados com a mesma frequência que as aplicações são utilizadas. Dependendo da aplicacão e da sua empresa, isto pode significar que as alterações ocorrem a cada segundo ou uma vez no final de cada ano fiscal. Dados dos Usuários Estes dados alteram de acordo com os padrões de uso da sua comunidade de usuários. Na maioria das empresas, isto significa que as alterações ocorrem toda hora. Baseando-se nestas categorias (e outras específicas à sua empresa), você deve ter uma boa idéia sobre a natureza dos backups necessários para proteger seus dados. Você deve ter em mente que a maioria dos software de backup lida com os dados no nível do diretório ou sistema de arquivo. Em outras palavras, a estrutura dos diretórios de seu sistema influenciam o modo como os backups serão feitos. Esta é uma outra razão para pensar cuidadosamente na melhor estrutura de diretórios para um novo sistema e agrupar arquivos e diretórios de acordo com seu uso antecipado. Software de Backup: Comprar versus Criar Para executar backups, é necessário ter primeiramente o software apropriado. Este software deve não somente executar a tarefa básica de copiar bits em mídia de backup, mas também interagir claramente com os funcionários e necessidades de sua empresa. Aqui estão algumas características a considerar ao analisar o software de backup: Agenda os backups para rodarem num horário apropriado Administra a localização, rotação e o uso da mídia de backup Trabalha com operadores (e/ou com alteradores de mídia robótica) para garantir que a mídia apropriada está disponível Auxilia os operadores na localização da mídia contendo o backup específico de um determinado arquivo Como você pode ver, uma boa solução de backup significa bem mais do que somente enviar bits para sua mídia de backup. Neste ponto, a maioria dos administradores de sistemas procura por uma das duas soluções: Comprar uma solução desenvolvida comercialmente Criar um sistema de backup internamente do zero (possivelmente intergrando uma ou mais tecnologias open source) Cada uma destas táticas tem seus pontos fortes e fracos. Dada a complexidade do trabalho, uma solução criada internamente provavelmente não atenderá alguns aspectos (como administração da mídia ou ter documentação detalhada e suporte técnico) apropriadamente. Entretanto, para algumas empresas, isto pode não ser uma desvantagem. Uma solução desenvolvida comercialmente provavelmente é altamente funcional, mas também pode ser muito complexa para as necessidades atuais da empresa. Sendo assim, a complexidade pode possibilitar continuar com a mesma solução conforme a empresa crescer. Portanto, não existe um sistema de backup claramente indicado para todos os casos. A única dica é pedir que você considere estes pontos: Mudar o software de backup é difícil; uma vez implementado, você o utilizará por um bom tempo. Acima de tudo, você terá backups arquivados por um longo tempo que possa ler. Mudar o software de backup significa que você terá que manter o software original (para acessar os backups arquivados), ou deverá converter seus backups arquivados para serem compatíveis com o software novo. Dependendo do software de backup, o esforço envolvido em converter os backups arquivados pode ser tão simples (mas demorado) quanto rodar os backups através de um programa de conversão já existente, ou pode ser necessária engenharia reversa no formato do backup e desenvolver software personalizado para executar a tarefa. O software deve ser 100% confiável — deve fazer o backup do que for necessário e quando for necessário. Quando chegar o momento de restaurar quaisquer dados — seja um arquivo ou um sistema de arquivos inteiro — o software de backup deve ser 100% confiável. Tipos de Backups Se você perguntar a alguém que não é familiarizado com backups, a maioria pensará que um backup é somente uma cópia idêntica de todos os dados do computador. Em outras palavras, se um backup foi criado na noite de terça-feira, e nada mudou no computador durante o dia todo na quarta-feira, o backup criado na noite de quarta seria idêntico àquele criado na terça. Apesar de ser possível configurar backups desta maneira, é mais provável que você não o faça. Para entender mais sobre este assunto, devemos primeiro entender os tipos diferentes de backup que podem ser criados. Estes são: Backups completos Backups incrementais Backups diferenciais Backups Completos O tipo de backup abordado no início desta seção é conhecido como um backup completo. Este tipo consiste no backup de todos os arquivos para a mídia de backup. Conforme mencionado anteriormente, se os dados sendo copiados nunca mudam, cada backup completo será igual aos outros. Esta similaridade ocorre devido o fato que um backup completo não verifica se o arquivo foi alterado desde o último backup; copia tudo indiscriminadamente para a mídia de backup, tendo modificações ou não. Esta é a razão pela qual os backups completos não são feitos o tempo todo — todos os arquivos são gravados na mídia de backup. Isto significa que uma grande parte da mídia de backup é usada mesmo que nada tenha sido alterado. Fazer backup de 100 gigabytes de dados todas as noites quando talvez 10 gigabytes de dados foram alterados não é uma boa prática; por este motivo os backups incrementais foram criados. Backups Incrementais Ao contrário dos backups completos, os backups incrementais primeiro verificam se o horário de alteração de um arquivo é mais recente que o horário de seu último backup. Se não for, o arquivo não foi modificado desde o último backup e pode ser ignorado desta vez. Por outro lado, se a data de modificação é mais recente que a data do último backup, o arquivo foi modificado e deve ter seu backup feito. Os backups incrementais são usados em conjunto com um backup completo frequente (ex.: um backup completo semanal, com incrementais diários). A vantagem principal em usar backups incrementais é que rodam mais rápido que os backups completos. A principal desvantagem dos backups incrementais é que para restaurar um determinado arquivo, pode ser necessário procurar em um ou mais backups incrementais até encontrar o arquivo. Para restaurar um sistema de arquivo completo, é necessário restaurar o último backup completo e todos os backups incrementais subsequentes. Numa tentativa de diminuir a necessidade de procurar em todos os backups incrementais, foi implementada uma tática ligeiramente diferente. Esta é conhecida como backup diferencial. Backups Diferenciais Backups diferenciais são similares aos backups incrementais pois ambos podem fazer backup somente de arquivos modificados. No entanto, os backups diferenciais são acumulativos — em outras palavras, no caso de um backup diferencial, uma vez que um arquivo foi modificado, este continua a ser incluso em todos os backups diferenciais (obviamente, até o próximo backup completo). Isto significa que cada backup diferencial contém todos os arquivos modificados desde o último backup completo, possibilitando executar uma restauração completa somente com o último backup completo e o último backup diferencial. Assim como a estratégia utilizada nos backups incrementais, os backups diferenciais normalmente seguem a mesma tática: um único backup completo periódico seguido de backups diferenciais mais frequentes. O efeito de usar backups diferenciais desta maneira é que estes tendem a crescer um pouco ao longo do tempo (assumindo que arquivos diferentes foram modificados entre os backups completos). Isto posiciona os backups diferenciais em algum ponto entre os backups incrementais e os completos em termos de velocidade e utilização da mídia de backup, enquanto geralmente oferecem restaurações completas e de arquivos mais rápidas (devido o menor número de backups onde procurar e restaurar). Dadas estas características, os backups diferenciais merecem uma consideração cuidadosa. Mídia de Backup Nós fomos muito cuidadosos ao usar o termo "mídia de backup" no decorrer das seções anteriores. Há uma razão para isso. A maioria dos administradores de sistemas experientes geralmente pensam em backups em termos de leitura e gravação de fitas, mas atualmente há outras opções. Houve um tempo em que os dispositivos de fita eram os únicos dispositivos de mídia removíveis que podiam ser usados para backups. No entanto, isto mudou. Nas seções seguintes, veremos as mídias de backup mais conhecidas e assim como suas vantagens e desvantagens. Fita A fita foi o primeiro meio de armazenamento de dados removível amplamente utilizado. Tem os benefícios de custo baixo e uma capacidade razoavelmente boa de armazenamento. Entretanto, a fita tem algumas desvantagens — está sujeita ao desgaste e o acesso aos dados na fita é sequencial por natureza. Estes fatores significam que é necessário manter o registro do uso das fitas (aposentá-las ao atingirem o fim de suas vidas úteis) e também que a procura por um arquivo específico nas fitas pode ser uma tarefa longa. Por outro lado, a fita é uma das mídias de armazenamento em massa mais baratas e carrega uma longa reputação de confiabilidade. Isto significa que criar uma biblioteca de fitas de tamanho razoável não abocanha uma parcela grande de seu orçamento, e você pode confiar no seu uso atual e futuro. . Disco Nos últimos anos, os drives de disco nunca seriam usados como um meio de backup. No entanto, os preços de armazenamento caíram a um ponto que, em alguns casos, usar drives de disco para armazenamento de backup faz sentido. A razão principal para usar drives de disco como um meio de backup é a velocidade. Não há um meio de armazenamento em massa mais rápido. A velocidade pode ser um fator crítico quando a janela de backup do seu centro de dados é curta e a quantidade de dados a serem copiados é grande. Mas o armazenamento em disco não é o meio ideal de backup, por diversas razões: Os drives de disco normalmente não são removíveis. Um fator essencial para uma estratégia de backup efetiva é ter os backups fora do seu centro de dados e mantê-los em alguma forma de armazenamento fora da emrpesa. Um backup do seu banco de dados de produção há um metro de distância do banco de dados propriamente dito não é um backup; é uma cópia. As cópias não são muito úteis, caso o centro de dados e seu conteúdo (incluindo suas cópias) seja danificado ou destruído por um conjunto de infortúnios. Os drives de disco são caros (ao menos se comparados a outras mídias de backup). Pode haver situações onde o dinheiro não é o problema, mas em todas as outras situações, as despesas associadas ao uso de drives de disco para backup significam que o número de cópias de backup deve ser baixo para manter o custo total dos backups também baixo. Um número menor de cópias de backup significa redundância menor, caso um backup não seja legível por alguma razão. Os drives de disco são frágeis. Mesmo se você gastar dinheiro extra com drives de disco removíveis, sua fragilidade pode ser um problema. Se você derrubar um drive de disco no chão, perde seu backup. É possível adquirir estojos especiais que podem reduzir (mas não eliminar totalmente) este problema, mas isto encarece ainda mais esta opção. Os drives de disco não são mídia de arquivamento. Mesmo assumindo que você seja capaz de resolver todos os outros problemas associados aos backups em drives de disco, você deve considerar o seguinte. A maioria das empresas tem requisitos legais bastante severos para a manutenção de registros disponíveis por determinados períodos de tempo. A chance de obter dados utilizáveis de uma fita de 20 anos atrás é muito maior que a chance de obter dados utilizáveis de um drive de disco de 20 anos. Por exemplo: você ainda teria o hardware necessário para conectá-lo ao seu sistema? Outra coisa a considerar é que um drive de disco é muito mais complexo que um cartucho de fita. Qual é a chance de um motor de 20 anos rodar um drive de disco de 20 anos, acessando as heads de leitura e gravação de 20 anos sem que nenhum componente apresente problemas após estarem ociosos por estes 20 anos? Alguns centros de dados fazem backup para drives de disco e então, quando os backups estão completos, são gravados em fita para propósitos de arquivamento. Isto permite o backup mais rápido possível durante a janela de backup. A gravação dos backups em fita pode ser feita durante o resto do dia útil; se a gravação acabar antes dos backups do dia seguinte serem feitos, tempo não é problema. Mesmo assim, ainda há alguns casos nos quais faz sentido ter backup em drives de disco. Na próxima seção veremos como eles podem ser combinados com uma rede para formar uma solução de backup viável (mas custosa). Rede Uma rede não pode agir como uma mídia de backup isoladamente. Mas, se combinada a tecnologias de armazenamento em massa, pode funcionar muito bem. Por exemplo: ao combinar um link de rede de alta velocidade a um centro de dados remoto contendo grandes quantidades de armazenamento em disco, as desvantagens mencionadas anteriormente de fazer backup em discos não são mais desvantagens. Ao fazer backup através de uma rede, os drives de disco já estão fora da empresa, portanto não há necessidade de transportar drives de disco frágeis a lugar algum. Com largura de banda suficiente, é possível manter a vantagem da velocidade que você pode obter ao fazer backups em drives de disco. No entanto, esta tática não resolve a questão do armazenamento em arquivos (apesar de poder usar a mesma estratégia de passar para a fita após o backup). Além disso, os custos de um centro de dados remoto com um link de alta velocidade ao centro de dados principal encarecem demais esta solução. Mas, para as empresas que precisam das características que esse tipo de solução pode oferecer, é um custo com o qual elas arcam com prazer. Armazenamento de Backups O que acontece após completar os backups? A resposta óbvia é que os backups devem ser armazenados. Entretanto, não é tão óbvio o que deve ser armazenado — e onde. Para responder a estas questões, devemos considerar primeiro sob quais circunstâncias os backups devem ser usados. Há três situações principais: 1. Pequenos e rápidos pedidos de restauração dos usuários 2. Grandes restaurações para recuperar de um desastre 3. Armazenamento em arquivos, pouco provável de ser usado novamente Infelizmente, há diferenças irreconciliáveis entre os números 1 e 2. Quando um usuário apaga um arquivo acidentalmente, ele pretende recuperá-lo imediatamente. Isto siginifca que a mídia de backup não pode estar há mais de dois passos distante do sistema para o qual os dados devem ser restaurados. No caso de um desastre que precisa de uma restauração completa de um ou mais computadores do seu centro de dados, se o desastre foi de natureza física, o que quer que tenha destruído seus computadores, também destruiria os backups localizados próximos dos computadores. Isto seria uma situação terrível. O armazenamento em arquivos é menos controverso. Já que a chance de ser utilizado para qualquer propósito é baixa, não haveria problema se a mídia de backup estivesse localizada há quilômetros de distância do centro de dados. As táticas para resolver estas diferenças variam de acordo com as necessidades da empresa em questão. Uma tática possível é armazenar o backup de diversos dias na empresa; estes backups são então levados para um local de armazenamento mais seguro fora da empresa quando os backups diários mais novos forem criados. Uma outra tática seria manter dois conjuntos diferentes de mídia: Um conjunto no centro de dados estritamente para pedidos imediatos de restauração Um conjunto fora da empresa para armazenamento externo e recuperação de desastres Obviamente, ter dois conjuntos significa ter a necessidade de rodar todos os backups duas vezes para fazer uma cópia dos backups. Isto pode ser feito, mas backups duplos podem levar muito tempo e copiar requer diversos drives de backup para processar (e provavelmente um sistema dedicado a executar as cópias). O desafio do administrador de sistemas é encontrar um equilíbrio que atenda adequadamente às necessidades de todos, e também assegurar que os backups estejam disponíveis para a pior das situações. Questões de Restauração Enquanto os backups são uma ocorrência diária, as restaurações normalmente representam um evento menos frequente. No entanto, as restaurações são inevitáveis; elas serão necessárias, portanto é melhor estar preparado. É importante atentar para os vários cenários de restauração detalhados ao longo desta seção e determinar maneiras para testar sua habilidade em resolvê-los. E tenha em mente que o mais dfiícil de testar também é o mais crítico. Restaurando do Zero "Restaurar do zero" significa restaurar um backup de sistema completo em um computador com absolutamente nenhum dado de nenhum tipo — sem sistema operacional, sem aplicações; nada. Em geral, há duas táticas básicas para restaurações do zero: Reinstalar, seguido de restauração Aqui o sistema operacional base é instalado como se um computador novo estivesse sendo configurado. Após instalar e configurar o sistema operacional, os drives de disco restantes podem ser particionados e formatados, e todos os backups restaurados pela mídia de backup. Discos de recuperação do sistema Um disco de recuperação do sistema é uma mídia iniciável (bootable) de algum tipo (geralmente um CD) que contém um ambiente de sistema mínimo, capaz de executar as tarefas mais básicas de administração de sistemas. O ambiente de recuperação contém os utilitários necessários para particionar e formatar os drives de disco, os drives de dispositivo necessários para acessar o dispositivo de backup e o software necessário para restaurar os dados pela mídia de backup. Alguns computadores têm a habilidade de criar fitas de backup iniciáveis e de inicializar através delas para começar o processo de restauração. No entanto, esta capacidade não está disponível em todos os computadores. Notavelmente, os computadores baseados na arquitetura PC não permitem está tática. Testando Backups Todos os tipos de backup devem ser testados periodicamente para garantir que os dados podem ser lidos através deles. É fato que, às vezes, os backups executados são por algum motivo ilegíveis. O pior é que muitas vezes isto só é percebido quando os dados foram perdidos e devem ser restaurados pelo backup. As razões para isto ocorrer podem variar desde alterações no alinhamento do cabeçote do drive de fita, software de backup mal-configurado a um erro do operador. Independente da causa, sem o teste periódico você não pode garantir que está gerando backups através dos quais poderá restaurar dados no futuro. Notas [1] Estamos usando o termo dados nesta seção para descrever tudo o que é processado através do software de backup. Isto inclui o software do sistema operacional, o software da aplicação e também os dados atuais. Não importa o que são; desde que a preocupação seja software de backup, tudo são dados.