Recuperação de desastres entre sites da
Microsoft
Soluções
Soluções completas utilizando o Clustering Failover do Windows Server
2008, Hyper-V e Soluções de replicação de dados de parceiros
Publicado: Dezembro de 2009
Resumo: Este documento descreve diversas soluções de recuperação de desastres
completas para ambientes virtualizados baseados no Windows. Estas soluções são
baseadas no Clustering Failover do Windows Server 2008, na tecnologia Hyper-V e em
soluções de replicação de dados de parceiros. As soluções demonstram capacidades de
failover automático em um ambiente geograficamente disperso e virtualizado da
Microsoft.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
ii
Direitos autorais
As informações contidas neste documento representam a visão atual da Microsoft Corporation sobre os temas discutidos na
data da publicação. Como a Microsoft deve responder às mudanças das condições de mercado, este documento não deve ser
interpretado como um compromisso da parte da Microsoft, e a Microsoft não pode assegurar a exatidão de qualquer
informação apresentada após a data da publicação.
Este documento tem fins apenas informativos.
A MICROSOFT NÃO OFERECE GARANTIAS, EXPRESSAS, IMPLÍCITAS OU
ESTATUTÁRIAS, QUANTO ÀS INFORMAÇÕES NESTE DOCUMENTO. O cumprimento de todas as leis pertinentes de direitos
autorais é de responsabilidade do usuário. Sem limitar os direitos sob o direito autoral, nenhuma parte deste documento
pode ser reproduzida, armazenada em, ou inserida em um sistema de recuperação de dados, ou transmitida de qualquer
forma ou por qualquer meio (eletrônico, mecânico, fotocópia, gravação ou outro), ou para qualquer fim, sem a permissão
expressa por escrito da Microsoft Corporation. A Microsoft pode deter as patentes, as solicitações de patentes, as marcas
comerciais, os direitos autorais ou outras propriedades intelectuais pertinentes ao objeto deste documento. Exceto quando
houver descrição expressa contida em qualquer contrato de licenciamento da Microsoft, o uso deste documento não concede
qualquer licença a patentes, marcas comerciais, direitos autorais ou outro tipo de propriedade intelectual.
 2009 Microsoft Corporation. Todos os direitos reservados. Microsoft, Hyper-V, Windows, Windows PowerShell e Windows
Server são marcas registradas ou comerciais da Microsoft Corporation nos Estados Unidos e/ou em outros países.
Os nomes de empresas e produtos reais aqui mencionados podem ser marcas comerciais de seus respectivos
proprietários.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
4
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
iii
Conteúdo
Sumário Executivo .................................................................................................................................... 5
Introdução ................................................................................................................................................... 5
Conceitos Principais ................................................................................................................................. 6
Componentes da solução de Recuperação de Desastres da Microsoft................................. 9
Soluções de Recuperação de Desastres em Ambientes Hyper-V ......................................... 13
Principais Benefícios do Windows Server 2008 Hyper-V e do WSFC para Recuperação
de Desastres ............................................................................................................................................. 19
Conclusão ................................................................................................................................................... 20
Informações Adicionais ......................................................................................................................... 20
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
5
Sumário Executivo
Este documento discute como as empresas podem criar soluções de recuperação de desastres
(DR) eficazes e de alta disponibilidade usando as capacidades de failover e virtualização da
Microsoft complementadas com produtos de replicação de dados de parceiros. Ele apresenta
diversas soluções de recuperação de desastres completas e disponíveis para diferentes
cenários. Cada cenário permite que as empresas selecionem um produto de parceiro da
Microsoft para fornecer gerenciamento de dados entre sites e replicação adequados para o
ambiente específico da empresa. As soluções discutidas neste documento são abordagens
genéricas para soluções de estruturação de recuperação de desastres em um ambiente HyperV geograficamente disperso com a ajuda de clustering.
As soluções discutidas têm como intuito fornecer exemplos de configuração de solução de
recuperação de desastres que clientes podem usar para avaliar e selecionar as soluções de
recuperação de desastres mais completas e adequadas às suas necessidades. Entretanto, este
white paper não tem a finalidade de ser um estudo exaustivo de arquiteturas específicas para
cada ambiente. Para avaliar requisitos de recuperação de desastres de datacenters específicos,
entre em contato com um representante de vendas da Microsoft.
Este documento foi criado para aqueles que possuem um conhecimento do Windows Server 2008
e de ambientes virtualizados do Windows Server.
O leitor também precisa entender a
terminologia de replicação e clustering.
Introdução
Para a Tecnologia da Informação (TI), reduzir os riscos de dados, sistemas e aplicativos críticos
(além de infraestruturas de computação em caso de interrupção de sistemas ou desastres
completos) representa um desafio contínuo, tanto do ponto de vista tecnológico quanto de
negócios. As empresas precisam encontrar soluções que não apenas atendam requisitos de
dados e aplicativos de maneira consistente para capacidade, desempenho e disponibilidade, mas
também possuam capacidades de redução de custos e retorno de investimento (ROI)
comprovadas.
A virtualização tem sido um divisor de águas para muitas empresas. Ela permite que empresas
que não eram capazes de lidar com a recuperação de desastres comecem a implantar soluções
de recuperação de desastres. A virtualização também permitiu que empresas justificassem
custos fornecendo recursos de recuperação de desastres completos para aplicativos adicionais.
Além disso, ela forneceu opções mais flexíveis para a eficácia de recuperação de desastres.
O desafio comercial é adquirir a capacidade de criar uma infraestrutura de servidor virtual
protegida, altamente disponível e econômica. Esta infraestrutura precisa garantir que aplicativos
atendam aos SLAs (Contratos de nível de serviço) definidos por negócios para disponibilidade e
preparação de recuperação de desastres. Este documento discute diversas opções que atendem
a esses requisitos.
O Clustering de Failover do Windows Server 2008 e a tecnologia Hyper-V, junto com soluções de
replicação de dados de parceiros, podem ser usados para criar soluções de recuperação de
desastres robustas, altamente disponíveis e econômicas. Para entender estas soluções, os
planejamentos de continuidade de negócios importantes e conceitos de recuperação de desastres,
bem como os componentes técnicos principais das soluções, precisam ser compreendidos.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
6
Conceitos Principais
O planejamento de continuidade de negócios é a capacidade de reduzir a interrupção
agendada e não agendada para sistemas de TI em uma empresa. A tecnologia Hyper-V™ da
Microsoft inclui recursos de continuidade de negócios poderosos, como Live Migration, que
permite que os negócios forneçam níveis de serviço de resposta e tempo de ativação
rigorosos.
Para minimizar os danos e retornar ao estado de operação normal rapidamente após uma
interrupção agendada ou um desastre, é necessário ter um bom planejamento de
continuidade de negócios. Um entendimento dos sistemas que precisam de proteção e o nível
necessário de proteção são fatores essenciais. Este conhecimento é normalmente formalizado
em um SLA (contrato de nível de serviço), e o departamento de TI se torna responsável por
ele. O SLA consiste em objetivos de recuperação de tempo (RTO) e objetivos de recuperação
de ponto (RPO), que são definidos para cada sistema que requer proteção. O RTO é a
duração de tempo e o nível de serviço nos quais um processo de negócios deve ser
restaurado após um desastre ou uma interrupção a fim de evitar consequências inaceitáveis
associadas à quebra de continuidade de negócios. O RPO é o período de tempo em que os
dados devem ser recuperados, conforme definido pela empresa. A recuperação de desastres
é um componente importante da continuidade de negócios que facilita a continuação das
operações de TI e de sistemas importantes após uma crise no nível do site por SLA, conforme
mostrado na Figura 1 abaixo. O Hyper-V utiliza as capacidades de clustering do Windows
Server 2008 para fornecer suporte para recuperação de desastres em ambientes de TI e
entre datacenters, usando capacidades de clustering dispersas geograficamente.
Continuidade de Negócios
Retomada de operações completas combinando pessoas, processos e
plataformas
Recuperação de Desastres
Área de proteção ou crise em nível de site, facilita a retomada de operações de TI para
aplicativos e acesso aos dados.
Alta Disponibilidade
Os casos de uso do clustering
local presumem uma falha
contida e que o resto do
ambiente é ativo.
Backup e Recuperação
Geralmente presume que a
infraestrutura é completa e 97%
dos casos de uso são
relacionados a uma pequena
unidade/arquivo.
Replicação
Coordenação síncrona ou
assíncrona de dados em
diferentes dispositivos de
armazenamento.
Figura 1. Estrutura de continuidade de negócios
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
7
Para compreender como a recuperação de desastres pode ser otimizada em um ambiente
virtualizado, é importante entender alguns aspectos técnicos essenciais. Estes aspectos
incluem servidor relacionado e funcionalidade de replicação em um ambiente de recuperação
de desastres, e estão descritos nas seções a seguir.
Funcionalidade de Servidor de Recuperação de Desastres
O clustering é uma função de servidor importante em um ambiente de recuperação de desastres.
Além do clustering, a adição de virtualização aprimora as capacidades e pode aprimorar o
desempenho de recuperação de desastres. Para ser completo, o plano de recuperação de
desastres precisa incluir um suporte Multipath I/O para garantir a alta disponibilidade do
armazenamento conectado.
Clustering
O clustering é normalmente dividido em três tipos conceituais: cluster de failover, cluster de
balanceamento de carga e computação em grade. A Microsoft possui as três capacidades de
clustering no sistema operacional Windows Server. Neste documento, o clustering de failover é o
foco. O clustering de failover é uma tecnologia muito madura que pode ser usada para aplicativos
de missão crítica, como servidores de impressão e arquivo, servidores de aplicativos, servidores
de banco de dados e assim por diante. Um cluster permite que dois ou mais servidores trabalhem
juntos como um grupo de computadores. Isso pode fornecer failover e aumentar a disponibilidade
do aplicativo e dos dados em qualquer situação. Se um nó primário começar a cair, o software de
failover baseado em uma técnica de pulsação dispara uma reinicialização automática de serviços
em nós secundários do cluster. Existem dois tipos de clustering de failover: clustering local e
stretch clustering.

Clustering local: Com o clustering local, todos os nós participantes do cluster estão na
mesma unidade ou datacenter e são acoplados fisicamente ao vínculo de pulsação. Esta
configuração pode fornecer failover de aplicativos, mas não pode sustentar a hospedagem
durante o tempo de inatividade que afeta toda a unidade ou datacenter. Por exemplo, se
todo o datacenter for afetado por um evento catastrófico, toda a unidade terá um tempo de
inatividade e não haverá um tempo de ativação máximo. Ainda assim, o clustering local é a
solução perfeita para aplicativos que precisam tolerar falhas imediatamente. Servidores de
domínio de autenticação e servidores Web de transações financeiras são exemplos de
servidores que podem afetar negativamente a infraestrutura se houver atraso de failover.

Stretch Clustering: O Strech clustering ou clustering disperso geograficamente atenua os
problemas que envolvem o clustering local. Quando um site primário fica inativo devido a
desastres naturais ou falha humana, o clustering local não é suficiente para alcançar o
tempo de ativação necessário de aplicativos de missão crítica. Se um site específico tem
clusters abrangendo diferentes áreas sísmicas, os aplicativos podem falhar no site
secundário que não é afetado pela interrupção do site primário. O Stretch clustering grava
dados para o sistema de armazenamento primário e o sistema de armazenamento remoto.
Isso amplia as capacidades de uma solução de cluster de failover única e garante proteção
contra tempo de inatividade com o Windows Server Failover Clustering (WSFC).
Virtualização
O WSFC suporta ambientes virtuais e físicos, incluindo configurações físico para físico, virtual
para virtual e físico para virtual. Ao suportar ambientes virtuais, a nova funcionalidade auxilia
soluções de recuperação de desastres. Por exemplo, o Windows Server 2008 R2 ampliou seu
conjunto de recursos WSFC com o recurso Clustered Shared Volume (CSV). Este recurso permite
acesso concomitante para arquivos de Disco Rígido Virtual (VHD) em um Número de Unidade
Lógica (LUN) do CSV. Isso é extremamente benéfico durante a Live Migration.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
8
Com o acesso concomitante aos arquivos VHD, não há atrasos de acesso em cenários de
desastres de sites. Isso representa um grande auxílio ao reduzir o RTO.
Suporte a Multipath I/O
O Windows Server 2008 R2 inclui muitos aprimoramentos para a conectividade de um
computador que executa o sistema operacional Windows Server para dispositivos de SAN (Rede
de área de armazenamento). Entre os aprimoramentos que permitem alta disponibilidade para
conexões de servidores baseados em Windows para SANs está o suporte a Multipath I/O (MPIO)
integrado. A arquitetura do MPIO da Microsoft suporta iSCSI, fiber channel e conectividade SAN
de armazenamento SAS ao estabelecer diversas sessões ou conexões para a matriz de
armazenamento.
As empresas podem tirar proveito do MPIO para implantar uma infraestrutura de solução de
armazenamento compartilhado confiável com redundância incorporada e integração coesa de
capacidades de gerenciamento de virtualização. A estrutura do MPIO da Microsoft fornece alta
disponibilidade e balanceamento de carga dinâmico para dispositivos SAN por meio de uma rede
redundante e conexões de malha. O MPIO da Microsoft encaminha dinamicamente entrada/saída
(E/S) para o melhor caminho e protege contra falhas em qualquer ponto da conexão entre um
host Hyper-V e armazenamento compartilhado, incluindo NICs/adaptadores, switches ou portas
de matriz.
Funcionalidade de Replicação de Recuperação de Desastres
Os produtos de replicação de dados de parceiros Microsoft ajudam as empresas a manter
conjuntos de dados consistentes entre sites para evitar a perda de dados durante failovers entre
sites. Como as técnicas de replicação de dados existentes suportam tanto o fiber channel quanto
a tecnologia Gigabit Ethernet, elas podem ser facilmente integradas a qualquer infraestrutura de TI
existente sem grandes modificações. Os modos de replicação de dados são geralmente classificados
como replicação síncrona ou assíncrona. Tanto as técnicas de replicação síncrona quanto de
assíncrona podem usar métodos de cópia de nível de bloqueio ou bytes. A cópia de nível de bytes
mantém uma cópia dos dados em cada nó do cluster e atualiza cada cópia conforme os dados são
alterados. A cópia de nível de bloqueio concede proteção de dados contínua que permite que os
dados sejam restaurados a qualquer momento, garantindo que todo o processo de replicação seja
rápido e eficiente. As seções a seguir discutem a replicação síncrona e assíncrona mais
detalhadamente.
Replicação síncrona
Com a replicação síncrona, as atualizações de E/S no cache de uma matriz de armazenamento
remoto precede as atualizações no local primário. A matriz de armazenamento remoto confirma a
conclusão E/S para o site primário, que, por sua vez, inicia o processo no site primário. Deste
modo, o aplicativo de gravação apenas recebe uma resposta de gravação completa do sistema de
armazenamento quando a operação de gravação E/S é concluída tanto no local de
armazenamento remoto quanto na localização de armazenamento local. Seu desempenho
depende fortemente da largura de banda da rede, da latência da rede e da distância. Para um
atraso mínimo de tempo de resposta de dados, a largura de banda da rede deve ser alta e a
distância e a latência da rede devem ser baixas. Isso faz com que o espelhamento síncrono seja
uma solução de replicação viável apenas para distâncias menores, de até 160 metros. Ele tem
também uma sobrecarga adicional de precisar de uma largura de banda de rede mais rápida. O
espelhamento remoto síncrono permite o nível mais alto possível de RPO e RTO.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
9
Replicação assíncrona
Na replicação assíncrona, o E/S é concluído no site primário sem qualquer requisito de
conhecimento do site secundário. A limitação de distância da replicação síncrona pode ser
superada em um modo de replicação assíncrona por uma arquitetura de conjunto delta que ajuda
a replicação a longa distância com tempos de sincronização personalizáveis. Os conjuntos delta
são coleções de gravações que ocorreram em um período de tempo específico. Diferentemente
do modo de replicação síncrona, os hosts não estão envolvidos no processo de replicação, o que
também ajuda a alcançar um melhor desempenho de E/S nos hosts. O desempenho é muito
ampliado, mas existe um risco potencial de perda de dados. Se o armazenamento local é perdido
devido a falha, a replicação assíncrona não garante que o armazenamento remoto tem
a cópia dos dados mais atuais. Portanto, os dados mais recentes podem ser perdidos
dependendo da configuração e das circunstâncias.
Os produtos de parceiros da Microsoft disponíveis atualmente oferecem suporte tanto para modos
de replicação síncrona quanto para assíncrona junto com modos de cópia de nível de bloqueio ou
nível de bytes para manter a conectividade de dados mesmo durante tempo de interrupção da
unidade de hospedagem completa, de hardware ou link. O usuário tem a liberdade de selecionar
um fornecedor de armazenamento único, um produto baseado em fornecedor de armazenamento
múltiplo ou produto baseado totalmente em software para implantar um ambiente de TI pronto
para recuperação de desastres.
Componentes da Solução de Recuperação de
Desastres da Microsoft
Ao considerar opções para recuperação de desastres, a virtualização é um divisor de águas. A
virtualização torna a recuperação de desastres acessível em termos de custos para empresas que
antes não podiam contar com este recurso. Por ser econômico, o planejamento de recuperação
de desastres pode ser ampliado ainda mais ao pool de aplicativos para oferecer melhores níveis
de serviços para mais aplicativos, para os quais o investimento não podia ser anteriormente
justificável. Com o Windows Server 2008, tudo o que você precisa para começar a usar a
virtualização está disponível. A funcionalidade de virtualização é criada diretamente no Windows
Server 2008 como a função Hyper-V.
Os principais componentes da Microsoft para soluções de recuperação de desastres incluem:

Windows Server 2008 com Hyper-V

Clustering de Failover do Windows Server

Microsoft System Center Virtual Machine Manager
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
10
Windows Server 2008 com Hyper-V
O Hyper‐V é a tecnologia de virtualização baseada em hipervisor da Microsoft que é integrada aos
sistemas operacionais Windows Server 2008 x64 Edition. Como uma solução de virtualização, o
Hyper‐V permite que usuários aproveitem ao máximo as vantagens do hardware de servidor,
fornecendo a capacidade de executar diversos sistemas operacionais (em máquinas virtuais) em
um único servidor físico. A disponibilidade do Hyper‐V como uma função em um sistema
operacional do Windows padrão fornece diversas vantagens importantes:
Recursos
Benefícios
Tecnologia integrada
O Hyper-V permite que as empresas utilizem
facilmente benefícios de virtualização sem adotar
novas tecnologias.
Amplo suporte a driver de dispositivo
A nova arquitetura de hipervisor micro-kernelizado de
64 bits usa o amplo suporte a driver de dispositivo na
partição pai do Windows Server 2008 para estender o
suporte a uma ampla matriz de servidores,
armazenamento e dispositivos.
Suporte a SMP
O Hyper-V oferece suporte a multiprocessadores
simétricos (SMP) em máquinas virtuais.
Alta disponibilidade de host
O clustering do Windows Server 2008 fornece alta
disponibilidade para máquinas virtuais, a fim de
reduzir o tempo de interrupção não planejado.
Alta disponibilidade de armazenamento
compartilhado
O MPIO da Microsoft encaminha dinamicamente E/S
para o melhor caminho e protege contra falhas em
qualquer ponto da conexão entre um host Hyper-V e
armazenamento
compartilhado,
incluindo
NICs/adaptadores, switches ou portas de matriz.
Migração de máquina virtual facilitada
Capacidade de Live Migration para oferecer suporte à
continuidade dos negócios durante o tempo de
interrupção planejado e não planejado e a distância.
Suporte a Serviço de Cópia de Sombra
de Volume (VSS)
Backup robusto de máquinas virtuais baseado em host
por meio da utilização de infraestrutura do Windows
baseada em VSS existente.
Fácil capacidade de extensão
Fácil capacidade de extensão usando as interfaces e
APIs do WMI (Windows Management Instrumentation)
baseadas em padrões.
Gerenciamento integrado simplificado
Com esta integração profunda da família de produtos do
System Center da Microsoft, os clientes têm recursos de
gerenciamento de infraestrutura virtual e física completos
para ambientes Hyper‐V.
Tabela 1. Recursos Hyper-V
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
11
Clustering de Failover do Windows Server
O clustering de failover do Windows Server 2008 ajuda a assegurar que seus aplicativos e
serviços de missão crítica, como email e aplicativos de linha de negócios, fiquem disponíveis
quando necessário. Além das capacidades já mencionadas na seção anterior de stretch clustering,
algumas outras capacidades importantes do WSFC para soluções de recuperação de desastres incluem:
Recursos
Benefícios
Sem limitação de sub-rede única
Permite que nós do cluster possam se comunicar entre
roteadores da rede. Não é mais necessário conectar os
nós às redes locais virtuais (VLANs).
Tempo limite de pulsação configurável
Aumenta para ampliar clusters dispersos
geograficamente em grandes distâncias. Diminui para
detectar falhas mais rapidamente e executa ações de
recuperação para um failover mais rápido.
Conjunto de ferramentas comuns
Experiência de gerenciamento semelhante para
gerenciamento de cluster local.
Failover automático em situação de desastre
completo em um local.
Failover automático
Suporte a VSS
Suporte a VSS para apoio a configurações de cluster.
Suporte a automação
Suporte para começo de automação no Windows Server
2008 R2 com Cluster PowerShell.
Combinação de ferramentas de
replicação entre sites
Armazenamento espelhado entre locais alongados.
Integração contínua com soluções de replicação de
dados baseadas em software ou hardware de parceiros.
Tabela 2. Recursos do Clustering de Failover do Windows Server
System Center Virtual Machine Manager
O Microsoft System Center Virtual Machine Manager 2008 é um software de gerenciamento de
classe empresarial que permite que administradores gerenciem tanto ambientes físicos quanto
virtuais de maneira facilitada e eficiente de um único console de gerenciamento, evitando assim a
complexidade de usar diversos consoles geralmente associados ao gerenciamento de uma
infraestrutura de TI.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
12
As principais capacidades do Virtual Machine Manager 2008 incluem:
Recursos
Pacote de gerenciamento de classe empresarial
Benefícios
Gerencia tanto ambientes de virtualização Hyper‐V
quanto VMware ESX.
Colocação de máquina virtual inteligente
Suporte à colocação inteligente de máquinas
virtuais.
Integração com o System Center Operations
Manager 2007
Trabalha com o System Center Operations Manager
2007 para fornecer gerenciamento proativo tanto de
ambientes físicos quanto virtuais por meio de um único
console, aproveitando a Otimização de Recursos e
Desempenho (PRO).
Migração virtual para virtual/física para
virtual nativa
Oferece capacidade nativa para migrações física para
virtual e virtual para virtual.
Integração de failover
Trabalha com o clustering de failover para oferecer
suporte à alta disponibilidade e Live Migration de
máquinas virtuais.
Automação
Oferece capacidades de automação fáceis que
utilizam o Windows PowerShell.
Tabela 3. Recursos do System Center Virtual Machine Manager
O System Center Virtual Machine Manager 2008 pode ser configurado de diversas maneiras,
dependendo dos requisitos de implementação. Uma configuração básica terá o Virtual Machine
Manager 2008 instalado e sendo executado em um servidor autônomo com discos locais no servidor
como armazenamento. Recomendamos anexar um compartimento de armazenamento ao
servidor autônomo que hospeda o Virtual Machine Manager se a implantação precisar de um servidor
de biblioteca relativamente maior. O servidor de biblioteca é uma capacidade criada no Virtual
Machine Manager para armazenar modelos VHD, arquivos de máquina virtual inativos, imagens ISO e
assim por diante.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
13
Soluções de Recuperação de Desastres em
Ambientes Hyper-V
Embora a alta disponibilidade possa ser alcançada com clustering local, isso não irá proteger
uma empresa contra a interrupção de todo o datacenter ou da unidade de hospedagem. Neste
caso, uma solução de recuperação de desastres precisa ter clusters dispersos geograficamente,
bem como meios de replicar dados a tais distâncias e capacidade de reiniciar totalmente a
infraestrutura a partir do site de cluster secundário.
Soluções de virtualização direcionadas à recuperação de desastres e que incluem replicação de
dados podem ser classificadas em três categorias. Conforme mostrado na Figura 2, estes tipos
incluem:

Soluções baseadas em software: soluções de replicação de dados baseadas em software
são pacotes de software de terceiros hospedados pelo servidor de aplicativos, que replica
dados pela rede de longa distância (WAN).

Soluções baseadas em equipamentos: com as soluções de replicação de dados
baseadas em equipamentos (appliances), toda a inteligência necessária para executar a
replicação é hospedada em um equipamento que reside no caminho E/S entre o host e o
armazenamento, geralmente em um SAN.

Soluções baseadas em matriz: em uma solução de replicação de dados baseada em
matriz, a replicação é nativa para os controladores de armazenamento.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
14
Tipos de solução para recuperação de
desastres
Área de proteção ou crise no nível local
Baseado em software
Soluções baseadas em host para gerenciar replicação de armazenamento e failover.
Baseado em equipamento
Replicação de dados e failover de armazenamento baseados em controlador/equipamento SAN.
Baseado em matriz
Replicação de dados e failover de armazenamento baseados em uma infraestrutura SAN
corporativa e intermediária.
Figura 2. Estrutura de recuperação de desastres
Soluções baseadas em software
Soluções baseadas em software usam aplicativos de software de terceiros que funcionam com a
tecnologia de Clustering de Failover do Windows Server para fornecer replicação de dados síncrona
ou assíncrona. A replicação baseada em software usa tecnologias patenteadas para replicar dados
pela WAN. Isso permite que clusters sejam expandidos em diferentes locais geográficos, bem como
em diferentes áreas sismógrafas, eliminando assim um único ponto de falha. Estas soluções podem
funcionar igualmente bem com ou sem o uso de armazenamento compartilhado dentro do cluster.
Tais pacotes de software junto com o WSFC podem fornecer uma solução de recuperação de
desastres econômica para configurações baseadas em Hyper-V.
Estas soluções também são chamadas de soluções baseadas em host porque residem no
servidor de aplicativos que precisam ter seus dados replicados. Portanto, um dos problemas da
replicação baseada em host é que ela leva o ciclo de processamento para longe dos aplicativos
executados no host. Outro problema é que quanto mais servidores precisarem usar a replicação,
maior é o custo, incluindo o custo inicial de cada licença de software, implementação e serviço,
bem como manutenção contínua. Por outro lado, os maiores benefícios de uma solução baseada
em host são que o custo pode ser muito baixo porque um SAN não é necessário e o
armazenamento heterogêneo pode ser usado.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
15
Figura 3. Replicação de dados baseada em
software
Como mostra a Figura 3, em caso de qualquer falha que cause uma interrupção na pulsação, o
WSFC executa o failover automaticamente e de maneira contínua para o segundo nó. O software
mantém uma cópia dos dados em cada nó do cluster e usa uma tecnologia de replicação
patenteada para atualizar cada cópia conforme os dados são alterados. Estas tecnologias de
replicação podem variar de operações de cópia em nível de bloqueio ou cópia byte a byte. O
software percebe o failover do aplicativo pelo WSFC e monta os volumes replicados em sites
secundários com acesso de leitura e gravação. Máquinas virtuais são automaticamente reiniciadas
no nó de backup com tempo de interrupção mínimo.
A integração da interface do usuário com o WSFC simplifica o gerenciamento e o monitoramento
de eventos. Por exemplo, a tecnologia de replicação de arquivo aberto é usada para fazer backup
de arquivos que estão atualmente sendo usados e aplicativos que estão abertos. Isso elimina a
necessidade de fazer com que as máquinas virtuais estejam offline para que os dados sejam
replicados.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
16
Soluções baseadas em equipamentos
A tecnologia de replicação baseada em equipamentos (appliances), como a baseada em host,
oferece suporte a todos os tipos de replicação. Diferentemente das soluções baseadas em host,
toda a inteligência necessária para executar a replicação é hospedada em um equipamento. Est e
equipamento reside no caminho E/S entre o host e o armazenamento, geralmente em um SAN.
A replicação baseada em equipamento tem mais vantagens que a replicação baseada em host.
Por exemplo, não há sobrecarga de replicação no servidor de aplicativos. Na verdade, o
aplicativo tem pouco ou nenhum conhecimento de que o equipamento existe ou que a replicação
está tomando seu lugar. Além disso, o gerenciamento de replicação é centralizado no
equipamento, e como as soluções baseadas em host, um pool de armazenamento heterogêneo
pode ser utilizado.
Entretanto, existem alguns problemas importantes em uma solução baseada em equipamento.
Para uma solução de alta disponibilidade, deve existir pelo menos dois equipamentos no site
local, configuradas como failover uma da outra, e pelo menos um equipamento disponível de
maneira remota. Devido ao fato do equipamento estar envolvido com cada E/S e não apenas
com os dados replicados, cada equipamento deve usar pelo menos quatro portas switch. Isso
pode adicionar custos e complexidade significativos para a infraestrutura de SAN. Além disso,
modernos subsistemas de disco podem fornecer E/S’s enormes por segundo e megabytes por
segundo. Isso permite que servidores de aplicaçõess utilizem o equipamento o máximo
possível. Portanto, o equipamento SAN no fluxo de E/S pode tornar-se um grande gargalo. Um
ambiente com grandes necessidades de E/S pode facilmente sobrecarregar um par de
equipamentos. Algumas soluções baseadas em equipamentos são limitadas a um par de
equipamentos enquanto outras podem alternar entre dois. Conforme mais equipamentos são
adicionados, o custo da solução aumenta, incluindo o custo de cada equipamento e porta
switch SAN, bem como suporte e outros incidentes.
Com a replicação baseada em equipamentos, quando os dados são gravados no armazenamento
primário, o equipamento salva os dados temporariamente no cache de hardware local e os
transferem para unidades locais de disco rígido. Quando os dados estão prontos para serem
sincronizados, ficam em uma fila espelhada. Com a ajuda do link de rede, os dados são então
copiados para a matriz par. Geralmente, as matrizes de destino estão indisponíveis para acesso
direto ou possuem acesso para apenas leitura para evitar a corrupção da cópia principal de dados
no destino. Os clientes podem implantar este tipo de infraestrutura robusta junto com WSFC e
virtualização Hyper-V para suportar quaisquer eventos catastróficos.
O link de replicação de dados tem que ser configurado entre a matriz do site primário e a
matriz do site secundário. A configuração do link de replicação é necessária para
estabelecer caminhos entre o sistema de armazenamento primário e secundário para a
replicação de dados baseada em equipamento.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
17
Figura 4. Replicação de dados baseada em equipamento
Conforme mostra a Figura 4, os sites perderão comunicação com a rede repentinamente ou em
cenários de interrupção do site. Após perder a próxima pulsação, o WSFC fará com que o
aplicativo falhe no servidor de ponto Hyper-V. Quanto ao armazenamento, LUNs replicados no
grupo de consistência na matriz secundária estarão disponíveis para o servidor de ponto Hyper-V
para E/S. Este processo pode ser executado manualmente ou completamente automatizado. A
automação pode ser feita na forma de scripts personalizados ou capacitadores de automação
específicos de fornecedores de armazenamento. LUNs que tenham máquinas virtuais Hyper-V
podem ser replicadas tanto no modo síncrono quanto no modo assíncrono, conforme requerido
para suportar o SLA.
Alguns fornecedores de armazenamento também fornecem um registro de dados ou recurso
journaling com a ajuda de um carimbo da data para evitar qualquer tipo de repetição. Este
recurso também aprimora a sincronização de tempo durante o failback para o nó do cluster
original.
Soluções baseadas em matriz
A replicação de dados baseada em matriz combina os aspectos de soluções baseadas em
equipamentos e em software. Como com a replicação baseada em equipamentos, não há
sobrecarga nos servidores de aplicativos. O gerenciamento é centralizado e qualquer host
suportado pelo sistema de armazenamento pode usar as funções de replicação do dispositivo de
armazenamento. Diferentemente das soluções baseadas em equipamentos, nenhuma porta de
switch SAN adicional é necessária para implementar a replicação baseada em armazenamento.
Já que a replicação é nativa para os controladores de armazenamento, o impacto é mínimo
para os servidores de aplicativos que utilizam o armazenamento. A única desvantagem da
replicação baseada em armazenamento é que a replicação pode apenas acontecer entre
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
18
sistemas de armazenamento Homogêneo. Anteriormente, o suporte apenas para homogêneo
era caro, mas hoje, muitos dispositivos de armazenamento permitem a replicação de
unidades de fiber channel mais custosas para unidades Serial Advanced Technology
Attachment (SATA) menos custosas, e também oferecem suporte à replicação remota de um
modelo de alta tecnologia para um modelo de baixa tecnologia.
Existe uma exceção interessante no suporte apenas para homogêneo. Ao usar controladores
SAN que suportam pools de armazenamento heterogêneo virtualizado, geralmente a replicação
heterogênea também é suportada. Neste caso, administradores SAN podem virtualizar
armazenamento heterogêneo em um pool de armazenamento, configurando a replicação em
níveis de volume. Volumes a serem replicados são agrupados em grupos de replicação para
garantir que todas as entidades de volume semelhantes sejam gerenciadas juntas. As técnicas
de pool de armazenamento também reduzem a sobrecarga de gerenciamento e diminuem a
complexidade da configuração.
Figura 5. Replicação de dados baseada em matriz
Conforme mostra a Figura 5, o controlador de hardware funciona na camada de rede do SAN e
distribui o E/S dos hosts para armazenamento, bem como para o controlador de hardware. No
caso de falhas na rede, no hardware ou no servidor, o WSFC inicia ações de failover baseadas na
política usada, e irá reiniciar o grupo de recursos no cluster. Neste cenário de stretch cluster,
cada nó do cluster vê o quorum como um recurso local e armazena todas as informações de
configuração em um disco local. O WSFC garante a integridade do cluster ao replicar alterações
nos nós do cluster. O WSFC protege contra falhas de hardware no servidor e interrupções de rede
e inicia ações de failover para reiniciar o grupo de recursos, enquanto os replicadores de dados
de hardware fornecem espelhamento remoto no modo síncrono ou assíncrono para replicar
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos
19
máquinas virtuais no Hyper-V. Durante a configuração de cluster, o administrador de
cluster tem de definir aplicativos, serviços, IP ou até mesmo discos no grupo de recursos
para que eles sejam transferidos para um nó de backup durante o failover de fato.
Quando o nó ativo no site primário falha ou o site inteiro falha, ocorre um tempo limite de
pulsação. Neste momento, o cluster reforma entre o site secundário e o nó FSW. O nó de cluster
de backup no site secundário faz com que grupos de recursos fiquem online com a ajuda do
FSW. O replicador de dados de hardware recupera volumes listados no grupo de recursos do
cluster no site secundário e monta no nó de backup com acesso de leitura/gravação. Aplicativos
mencionados no grupo de recursos são iniciados automaticamente pelo WSFC no nó de cluster de
backup. Assim que tudo estiver pronto, máquinas virtuais no nó de cluster de backup em sites de
recuperação são iniciadas automaticamente e as operações são retomadas do ponto de falha. O
total de failover e failback automatizados pode ser alcançado com scripts personalizados ou com
capacitadores de automação oferecidos pelo fornecedor de replicador de dados de hardware.
Junto com capacitadores baseados em fornecedor, as soluções baseadas em matriz podem
funcionar perfeitamente com WSFC para operações de espelhamento remoto. Este único produto
pode ajudar a aumentar a eficiência, simplificar as práticas de gerenciamento de
armazenamento e atenuar o risco com objetivos de negócios em um pool de armazenamento
heterogêneo.
Principais Benefícios do Windows Server 2008
Hyper-V e do WSFC para Recuperação de Desastres
A combinação do Hyper-V com o WSFC pode reduzir o impacto de interrupções no caso de
falhas de qualquer componente de hardware ao realocar as máquinas virtuais para o nó que
está em funcionamento. Ao expandir o cluster geograficamente e adicionar uma solução de
parceiro de replicação de dados, a solução de alta disponibilidade é transformada em uma
solução de recuperação de desastres ponta a ponta e completa.
A virtualização junto com o cluster expandido é uma solução diferenciada e econômica para
manter quase que 100% de tempo de ativação para aplicativos de alta disponibilidade e missão
crítica. O Windows Server 2008 com Hyper-V permite que qualquer empresa se beneficie da
virtualização e da tecnologia WSFC em diferentes locais geográficos. O Hyper-V fornece uma
arquitetura aprimorada de segurança de maneira inerente que é mesclada perfeitamente em um
ambiente de TI existente, simplificando processos, provisionando e gerenciando.
Outras vantagens de alta disponibilidade da virtualização com Hyper-V incluem atualizações do
sistema operacional. As atualizações são consideravelmente simplificadas porque as máquinas
virtuais podem ser migradas para o nó par com a Live Migration sempre que uma reinicialização
do nó primário for necessária. Isso ajuda a garantir que não haja tempo de interrupção para o
usuário final. O suporte CSV com Live Migration no Hyper-V aprimora ainda mais o failover com
o mínimo ou nenhum tempo de interrupção.
Alguns benefícios adicionais do Hyper-V para a TI em geral de uma empresa incluem:

Arquitetura de micronúcleo de 64 bits.

Suporte a diversos sistemas operacionais.

Suporte a multiprocessador simétrico.

Balanceamento de carga de rede com um switch virtual.

Nova arquitetura de compartilhamento de hardware de provedor de serviços/cliente de serviços
virtuais.
Microsoft Corporation ©2009
Recuperação de desastres em um ambiente virtual entre sites geograficamente dispersos

Instantâneo de máquina virtual.

Interfaces do Windows Management Instrumentation (WMI) e APIs para fornecer
extensibilidade para desenvolver ferramentas ou utilitários personalizados.

Backups em tempo real com o VSS.
20
Conclusão
Os motivos pelos quais um plano de recuperação de desastres é necessário para qualquer
empresa global são óbvios, mas os custos sempre foram motivo de proibições que limitam a
existência e ampliação destes planos. A virtualização é hoje um divisor de águas para o
planejamento de recuperação de desastres, fornecendo soluções de recuperação de desastres
por uma fração de custos não virtualizados. Isso está fazendo com que empresas que
anteriormente não podiam investir na recuperação de desastres implementem soluções eficazes
e flexíveis. Além disso, sua acessibilidade está permitindo às empresas justificar totalmente a
recuperação de desastres para aplicativos adicionais, além de aprimorar seus SLAs. A
virtualização também criou mais opções para a recuperação de desastres efetiva, a fim de
alcançar uma ampla gama de necessidades.
As soluções de recuperação de desastres discutidas neste documento utilizam a força do Hyper-V
e WSFC da Microsoft, combinados com soluções de replicação de dados de parceiros. A
abordagem fornece soluções confiáveis que cobrem quaisquer requisitos de recuperação de
desastres. Entretanto, a seleção real de possíveis abordagens de recuperação de desastres em um
ambiente Hyper-V depende de fatores importantes, como custos, estado crítico e distância entre
os locais, e deve ser discutido com um representante da Microsoft treinado para auxiliar no
planejamento de soluções de recuperação de desastres.
Informações Adicionais
O ecossistema de parceiros abrangente da Microsoft complementa e estende nosso conjunto de
ferramentas de virtualização com produtos para estações de trabalho, servidores, aplicativos,
armazenamento e redes. Junto com parceiros, a Microsoft fornece soluções completas e
robustas para uma infraestrutura virtualizada e pronta para recuperação de desastres.
O Windows Server 2008 com Hyper-V e WSFC, junto com o produto de replicação de dados
baseada em matriz, equipamento ou software de parceiro correto, fornece uma ampla
variedade de soluções para necessidades importantes de recuperação de desastres.
Para mais informações acesse os seguintes recursos:

Soluções de Virtualização Microsoft:
www.microsoft.com/brasil/virtualizacao

Parceiros de Virtualização Microsoft:

www.microsoft.com/virtualization/partners

Informações de produto do Microsoft Windows Server 2008 with Hyper-V:
www.microsoft.com/windowsserver2008/pt/br/hyperv-main.aspx

Informações de produto do Microsoft System Center Virtual Machine Manager:
www.microsoft.com/systemcenter/virtualmachinemanager/en/us/default.aspx
Microsoft Corporation ©2009
Download

Recuperação de desastres entre sites da