WHITE PAPER Otimizando a performance da rede para melhorar a performance dos seus sistemas Abril 2013 Para enfrentar a latência, ganhando seu controle, você precisa entender as necessidades de seus aplicativos, usando-as para ditar a maneira como você usa os recursos da WAN Sumário Executivo As aplicações de negócios crescem continuamente em complexidade. Gerentes de TI têm a tarefa de continuar a lidar com antigas aplicações, adicionar novas e espremer cada bit de desempenho possível dos recursos existentes. O objetivo real não deveria ser gastar menos ou poupar mais. Em última análise, é criar o maior valor de negócio a partir de poucos recursos. O impacto que a Wide Area Network (WAN) tem sobre o processo global de negócios está crescendo. Uma característica da WAN, mais do que qualquer outra, é a chave para melhorias significativas no desempenho de suas aplicações: latência. Latência não é uma questão simples de resolver, pois se manifesta em muitas áreas de sua rede. Para lidar com a latência e ter seu controle, você precisa entender os requisitos das suas aplicações, usando-os para direcionar a maneira como você emprega seus recursos de WAN. Introdução As aplicações de negócios de hoje são muito diferentes daqueles que rodavam até poucos anos atrás. Nos últimos tempos, as empresas têm sido forçadas a automatizar os processos de forma muito mais agressiva. Progressivamente elas tem se voltado aos seus departamentos de TI, procurando maneiras de espremer cada bit de performance a partir de seus recursos. Com a virtualização, os servidores foram ainda mais exigidos – já que eliminou-se a duplicação de dados por meio da consolidação de data centers, além da terceirização de sistemas. Então, onde estamos agora? Na década de 1980, as aplicações rodavam em computadores; hoje, as aplicações funcionam em redes. Nós trabalhamos em ambientes distribuídos, tiramos vantagem da colaboração, compartilhamos documentos e mais do que nunca usamos recursos on-line. Os ambientes conversam entre si e, sem a presença de uma rede, isso não seria viável. O desafio para a área de TI neste complexo mar de mudança é assegurar que as aplicações não somente funcionem; precisam continuamente buscar formas de otimizar sua performance. Page 1 WWW.LEVEL3.COM Um Exemplo de Aplicação A otimização de desempenho de uma aplicação requer uma compreensão de todo o processo de negócio que este suporta. Veja a Figura 1. Este é um exemplo de um ambiente multi-camada que suporta um sistema de automação de pontode-venda. De uma perspectiva do negócio, o processo funciona assim: a pessoa que trabalha no caixa escaneia a etiqueta da mercadoria e o código de barras é transmitido para o terminal. Figura 1 - Exemplo de Rede WAN multicamadas para uma rede varejista Do terminal, uma busca é feita junto ao servidor da loja para localizar o valor, atualizando o status do inventário. Além disso, o software instalado no servidor rastreia o inventário e, se necessário, libera uma ordem automatizada para reabastecer o estoque local junto ao armazém regional. Os dados regionais são coletados em uma base regular, que alimenta outra base de dados nacional, permitindo a extração de relatórios de venda e análises de mercado. Do ponto de vista da rede, os dados são transportados a partir das localizações individuais de cada loja para o data center regional. Estes links podem variar, desde linhas privadas de baixa velocidade até soluções multiponto como MultiProtocol Label Switching (MPLS). Normalmente, as conexões utilizadas entre os data centers regionais e o data center nacional são de altas velocidades, devido ao volume de dados a serem transferidos e também para conferir maior confiabilidade. Fatores para performance no processo de negócio Embora seja importante entender todo o cenário, neste white paper vamos nos concentrar em como esse modelo afeta o desempenho geral das aplicações que ele suporta. Ao examiná-los, surgem vários fatores que agruparemos baseados na Page 2 forma como se relacionam. Há quatro áreas gerais que têm um impacto sobre o desempenho geral do sistema: o processo, a Rede de Área Local (LAN), os recursos de computação ou servidores, e a Wide Area Network (WAN). Veja a Figura 2. Figura 2 - Fatores para performance no processo de negócio, dentro do exemplo varejista. Cada uma dessas esferas pode ser examinada e aperfeiçoada. Primeiramente considere o processo de negócio propriamente dito. Dentre os fatores que influenciam sua eficiência, podemos listar a quantidade de terminais para checkout, o volume de transações e a produtividade do empregado. Em seguida, vemos a LAN. Como ela foi projetada? Quantos dispositivos ele suporta e em que velocidade essa LAN opera? Depois, considere os atuais servidores nos data centers. São usadas máquinas reais e/ou virtuais? E que tipo de storage é usado? Por fim, temos a WAN que é utilizada para conectar todas as diferentes camadas em conjunto. Como ela foi desenhada? Que tipos de serviços são utilizados? Quais são seus parâmetros de performance? A influência da WAN no desempenho de aplicativos é tão significante quanto os outros fatores que mencionamos antes – e, para algumas partes da aplicação, é o fator primordial. Fatores de Desempenho da WAN A Normalmente, a primeira coisa a se considerar quando tratamos da eficiência da WAN é a velocidade ou a largura de banda. Para outras aplicações, também poderíamos considerar a disponibilidade ou a confiabilidade do serviço. Depois, há a escalabilidade ou a elasticidade do serviço: quão bem ela está ajustada para fornecer as quantidades corretas de largura de banda ou a classe de conectividade que as aplicações precisam? Se você está usando streaming de vídeo ou voz sobre IP, você pode até querer saber qual jitter o serviço está sujeito. Características WAN que influenciam o desempenho do aplicativo: Disponibilidade – a quantidade de tempo que uma rede está disponível para processamento Largura de banda – capacidade, ou o volume de dados que pode trafegar sobre uma rede Escalabilidade – o quanto o serviço se ajusta (ou permite ampliação) para fornecer as quantidades corretas de largura de banda que um aplicativo necessita. Latência – a quantidade de tempo que uma mensagem leva para ser transportada de um ponto a outro da rede Todos esses fatores influenciam no desempenho; no entanto, a latência (a quantidade de tempo que uma mensagem leva para ser transportada de um ponto a outro na rede) é a principal característica da WAN que afeta a performance de uma aplicação. Page 3 WWW.LEVEL3.COM A menor latência Há muito poucas aplicações que requerem latências absolutamente baixas. O que geralmente se procura é uma latência baixa e consistente. Todavia existem algumas aplicações que se beneficiam de ter as latências mais baixas possíveis. Para estas aplicações, o mais rápido serviço de WAN disponível é um comprimento de onda DWDM, ou mais simplesmente, uma onda. A latência de rede em larguras de banda muito elevadas contribui muito pouco na fração da latência total. À medida que a rede torna-se mais rápida, a distância física entre os pontos finais se torna o fator limitativo na redução da latência. As soluções DWDM são ativadas diretamente dos cabos de fibra que ligam os centros de serviços das operadoras. Eles trabalham no domínio óptico, o que significa que a informação circula principalmente na forma de luz, não como sinais eléctricos. Projetar e manter estas ligações ultrarrápidas exige um conhecimento bastante específico. Mesmo algo tão simples como uma junção de cabos de fibra ótica é algo que requer atenção redobrada. Se você tem o tipo de aplicação que precisa da menor latência possível, a Level 3 é líder no fornecimento de rotas de alta velocidade, graças a nossa extensa rede de fibra ótica ao redor do globo Page 4 Considere o exemplo dos sistemas de varejo. A título de ilustração, em vez de enviar a informações sistêmicas através de um pacote eletrônico, vamos enviá-las via serviço postal. Sabendo que a disponibilidade do serviço é fundamental, se o caminhão do correio não tem capacidade suficiente para carregar todas as cartas, isso impedirá o funcionamento da aplicação. Se o veículo tiver atrasos na entrega – por exemplo: às vezes, demorando cinco dias e, noutras vezes, levando dez dias para entregar a correspondência – isso também interromperá o sistema. Entretanto, nesses cenários, precisamos entender que a aplicação não está somente com uma performance ruim – ela está com defeito. Agora vamos assumir que não tenhamos qualquer uma dessas questões: os caminhões são sempre pontuais, sempre disponíveis, com a capacidade de carga especificada. Porém, ele consistentemente leva cinco dias para entregar uma mensagem entre o ponto A e o ponto B. Nesse caso, a aplicação funciona, só não está executando suas tarefas da melhor forma. Se for possível pedir para os caminhões aumentarem a velocidade, os benefícios serão óbvios. Se pudermos encurtar o tempo de viagem dos caminhões, teremos um impacto imediato sobre o desempenho da aplicação. A latência é um problema-chave no desempenho na WAN. Muitas vezes, planejadores de TI pegam atalhos comprando caminhões maiores e melhores – mais capacidade e maior disponibilidade fora da WAN. Porém, primeiramente, eles deveriam pensar na latência. Latência Latência não é uma questão simples. Certamente, a adição de mais capacidade ou largura de banda reduz as latências, mas só até um certo ponto. Uma vez que a velocidade da rede atinge um determinado patamar, a velocidade da rede contribui para uma porção muito pequena do total da latência. Veja a Figura 3: Figura 3 - Fontes de Latência de uma Rede WAN A latência é influenciada pela combinação dos seguintes pontos: • a velocidade dos servidores mais a rede local; • a velocidade de comutação dos routers; • a distância física entre os pontos; • e a largura de banda disponível da WAN para suportar a aplicação. A Figura 3 mostra o percentual que cada um destes fatores contribui na latência de um pacote de 256 bytes viajando a aproximadamente 800 Km/h ao longo de um hop, utilizando equipamento padrão de rede. Há duas coisas para apontarmos aqui. Primeiro, há alguns fatores sobre os quais você não tem influência. Por exemplo, a distância que o pacote tem que viajar é fixa. No caso do nosso exemplo de varejo, provavelmente você determinou a localização das lojas pelas regiões onde você entende que pode vender mais, não porque elas estão situadas nas rotas mais curtas de rede. Em segundo lugar, tenha em conta que a largura de banda de rede disponível não é o mesmo que a largura de banda total do link WAN. Nenhuma rede suporta apenas uma aplicação. Num mesmo momento, o sistema do pontode-venda está usando a rede, o gerente da loja verifica e-mails, o sistema de climatização ajusta as temperaturas no interior da loja e executa um streaming de música da Internet para o sistema de áudio da loja. Resumindo, a latência é impactada por fatores fixos que podemos entender – porém sem muito espaço para influenciá-los – e por outros fatores variáveis com os quais podemos lidar. Contenção e Latência Essas variáveis podem ser descrita em termos de contenção. Reconsidere a aplicação usando o exemplo postal. Quando o caminhão aparece para pegar a correspondência, há todos os tipos de mensagens esperando transporte. Algumas são importantes e outras são menos prioritárias. Como organizar o que entra primeiro no caminhão? Ou melhor, todas elas devem ser enviadas nesse caminhão? Se há recursos ilimitados, não temos com que nos preocupar: basta comprar um caminhão maior. Mas e se não temos recursos ilimitados e queremos usar cada centímetro quadrado dentro desse caminhão? O que será levado e o que ficará em espera? Alguns serviços de WAN não conseguem tomar essa decisão. O caminhão aparece e carrega as correspondências até que fique lotado. O que se encaixa vai e tudo o que não cabe é deixado para trás. Se outro caminhão estacionar, essas mensagens serão as próximas a se despachar. Para algumas aplicações, isso não é um problema: suas mensagens não são sensíveis ao tempo e se chegarem fora de ordem ou com quantidades variadas de atraso não haverá problema. Entretanto, noutros sistemas, isso seria um desastre. Como afirmamos anteriormente, a solução típica para os planejadores de TI é comprar mais largura de banda. No entanto, existem formas mais eficientes para endereçar essa questão. Isso requer uma compreensão de como suas aplicações reagem à latência - e compreender como sua WAN funciona. Requisitos de WAN para Aplicações Cada aplicação coloca diferentes exigências sobre a WAN. Veja os requisitos do exemplo de aplicação da Tabela 1. Uma aplicação comum como e-mail possui requisitos mínimos. Ela geralmente requer pequenas quantidades de largura de banda por usuário e não é severamente afetada por latência ou jitter. VoIP não requer muita largura de banda e é tolerante a latência, porém é muito sensível ao jitter. Por fim, considere um sistema de telepresença; ele requer grande quantidade de banda e está sujeito a degradação do sinal em virtude de latência excessiva, conforme mostra a tabela. Page 5 WWW.LEVEL3.COM Aplicação Mensagem de e-mail Largura de banda requerida Sensibilidade a erros Sensibilidade à Latência Sensibilidade ao Jitter Burstiness Muito baixa Baixa Baixa Baixa Média Voz (TDM) Baixa Baixa Baixa Alta Baixa Voz sobre IP (VoIP) Baixa Média Baixa Alta Baixa Navegação na internet (não-crítica) Média Média Média Média Média Navegação na internet - SaaS Alta Média Alta Média Média Videoconferência Alta Média Média Alta Alta Muito Alta Alta Alta Alta Alta Média Média Alta Média Alta Telepresença Trabalho remoto Streaming Media Armazenamento em rede Virtualização de Servidor (WAN) Comunicações Unificadas Alta Alta Média Alta Alta Muito Alta Alta Alta Alta Alta Alta Alta Alta Alta Alta Média Média Média Média Alta Tabela 1 - Requisitos de aplicações em WAN A latência é impactada por fatores fixos que podemos entender – porém sem muito espaço para influenciá-los – e por outros fatores variáveis com os quais podemos lidar. Continuando, considere outro cenário onde a rede precisa suportar essas três aplicações: telepresença, VoIP e e-mail. Telepresença é a aplicação mais pesada. Como ela requer muita largura de banda, é um desafio suportá-la eficazmente; até por isso ela geralmente é realizada em períodos de tempo determinados. Pode-se comprar largura de banda suficiente para suportar todos os aplicativos sem prejuízo, entretanto pagaremos por uma enorme largura de banda que ficará sem uso por longos períodos de tempo. Dito isso, vamos avaliar o funcionamento da WAN. A WAN em Linha Privada O tipo mais comum de conectividade WAN é a linha privada ou Circuito de Divisão de Tempo Multiplexados (TDM). A rede TDM tem sido presente por um longo tempo. É o legado do mundo de voz, que exigiu muitas conexões de baixa velocidade, individuais e com alta qualidade. Esta tecnologia suporta altíssima disponibilidade, porém frequentemente demanda recursos backup dedicados. Em termos de latência, ela é tipicamente mais baixa em comparação a outras tecnologias. Não tem as menores latências, contudo é muito consistente (baixíssimo delay). Por isso que sistemas TDM não admitem jitter. Linhas privadas suportam enormes capacidades; muitos serviços de rede são baseados em linhas privadas como a conectividade de backbone. Todavia, esse serviço não é muito escalável ou elástico. Isso acontece em virtude do mapeamento dedicado que é necessário para montar um circuito. E tantas configurações disponíveis traduzem-se em opções limitadas de velocidade. Linhas privadas também têm uma característica única. Lembre-se do caminhão postal? Pense numa linha privada que seja realmente confiável, ela é um caminhão carga-pesada. Ele funciona bem e viaja sempre à mesma velocidade. Sua caçamba tem um tamanho fixo e é bem protegida para não quebrar suas encomendas. Entretanto ele sempre carrega um mesmo volume. Não há problema se você respeitar esse limite; contudo se você sobrecarrega-lo, os itens extras não caberão e ficarão para trás. Tecnicamente falando: a contenção é forçada no seu roteador, Page 6 na sua localidade. Se você sobrecarrega a sua linha privada, o roteador será forçado a acumular esses dados, eventualmente descartando-os. O TDM é um serviço de alta qualidade - mas tem um preço. Primeiramente, ele custa mais por conta da confiabilidade (que você pode ou não precisar). Segundo, não é tão flexível em termos de contenção. Por outro lado, se você não saturá-lo, pode-se contar com a consistência de sua latência. A Internet como WAN Pensando em acesso a grandes larguras de banda a baixo custo, é difícil superar a Internet pública. Muitas empresas dependem da Internet como o acesso que nós mostramos em nosso modelo multi-camadas (ver figura 1). Mas como um serviço de WAN, sua milhagem pode variar. Bem, vamos considerar como a Internet pública pode ser caracterizada como um serviço de WAN. A disponibilidade do serviço estaria sujeita a vários fatores. Primeiro, há a disponibilidade de serviço do seu provedor. Alguns provedores de acesso vão lhe dar uma garantia de disponibilidade, e outros não. Em seguida, há a confiabilidade da própria Internet. E aqui há uma espécie de dicotomia. A Internet é muito resiliente. Falhas acontecem e muitas vezes elas são contornadas sem que os usuários tomem conhecimento. Dentro da Internet, as falhas são desviadas e o tráfego flui por diferentes caminhos. Para a maioria das aplicações de Internet isso é ótimo. Mas para um VoIP isso poderia significar uma queda de ligação que não poderá ser reestabelecida. Isso não é muito crítico para um usuário em lazer; todavia, pode ter um impacto significativo nos negócios. Como você está confiando em um serviço que é formado pela cooperação de muitos provedores – cada um destes com suas diferentes redes – você nunca terá certeza de como seus dados vão chegar. Devemos dizer que a forma como a Internet funciona não é completamente indefinida. Algumas operadoras (por exemplo, a Level 3) gerenciam sua rede bem de perto. Contudo, é na latência onde a Internet apresenta seu maior impacto. Sabendo que o tráfego pode pegar diversos caminhos até alcançar o seu destino, o tempo de chegada pode variar. Por outro lado, diferentemente de um serviço de linha privada, pode-se trabalhar com contenção dentro da rede. Como sua mensagem não ser descartada, ela poderá ser retida ou atrasada em seu caminho para o seu destino. Obviamente, o jitter também é uma preocupação, como o caminho e o tempo de viagem que podem variar entre cada pacote. Um aspecto bastante positivo sobre a Internet é que você pode obter grandes quantidades de largura de banda, facilmente escaláveis. A largura de banda é criada com base em volumes e não em intervalos de tempo; não há larguras de banda pré-definidas. Os únicos limites são ditados pela tecnologia de entrega. Algo que você pode fazer para ajudar a trazer consistência no funcionamento da sua WAN pela Internet é usar o mesmo provedor em todas as suas conexões. Dessa forma você manterá o máximo possível do seu tráfego dentro da mesma rede. No linguajar da Internet, você irá mantê-lo num sistema autônomo único. Isso é ainda mais relevante quando se trata de cloud computing: se você utiliza serviço de Page 7 WWW.LEVEL3.COM computação na nuvem, saiba qual provedor seu prestador de serviços usa e prefira empregar o mesmo provedor. MPLS – a última tecnologia em WAN Any-to-Any distributed connectivity: forma de arquitetura digital em que sistemas computacionais se comunicam e interoperam com outros sistemas, criando ‘conexões lógicas’ ao invés de conexões físicas. Em outras palavras, o cliente pode ligar qualquer dispositivo de qualquer ponto de entrada da rede, para qualquer distribuidor, em qualquer momento. A Multi-Protocol Label Switching (MPLS) não é um serviço em si mesmo. Como o TDM, a MPLS é uma tecnologia usada para criar serviços. Alguns dos serviços criados pelo MPLS são a Ethernet Virtual Private Line (EVPL) e a Virtual Private LAN Service (VPLS). A EVPL é um serviço de ponto-a-ponto e, em muitos aspectos, semelhante a um serviço de linha privada. A VPLS, no entanto, é um serviço “any-to-any connectivity”, como a Internet pública, porém funcionando através de recursos virtuais da rede privada. A maioria dos serviços baseados em MPLS usa mecanismos de restauração da malha. Isto significa que, na eventualidade de uma falha de rede, a rede irá executar um reencaminhamento no entorno da área afetada. Trata-se de uma estratégia de proteção mais eficiente, no entanto, não é tão robusta quanto às linhas privadas. Em termos de delay ou latência, a rede pode ser muito rápida. Elas normalmente têm menos hops do que as redes de Internet e oferecem um roteamento mais consistente. Em termos de capacidade, as redes MPLS podem oferecer tanta largura de banda tanto quanto qualquer outro tipo de serviço. Velocidades acima de um gigabit são comuns, e muitos fornecedores, como a Level 3, oferecem conexões de 10-gigabits. No quesito escalabilidade e elasticidade, as redes MPLS são superiores à maioria das outras tecnologias de WAN. Quando combinado com Ethernet, nenhum outro serviço de WAN tem a capacidade da MPLS em corresponder à largura de banda disponível necessária. O recurso que dá essa flexibilidade MPLS é a Classe de Serviço (CoS). A exemplo da Internet pública, a contenção pode acontecer dentro de uma rede MPLS. Porém, na Internet, a contenção causa quantidades variáveis de atraso baseados puramente na posição que uma mensagem tem na fila do roteador. Em uma rede MPLS, as mensagens são marcadas com essa etiqueta CoS. Em caso de sobrecarga, as mensagens identificadas com prioridade pelo CoS são enviadas primeiro. Performance de rede viabilizando performance de sistema Vamos retomar o cenário abordado anteriormente, onde pretendíamos viabilizar telepresença, VoIP e aplicações de e-mail em uma mesma rede. Uma rede MPLS seria uma solução ideal. Primeiramente, só teremos de contratar largura de banda suficiente para suportar o número máximo de sessões simultâneas de telepresença mais a quantidade mínima de chamadas VoIP simultâneas. Podemos usar os tags de CoS para identificar o tráfego de telepresença como o tráfego de maior prioridade, marcar o VoIP como prioridade normal, e os e-mails com a prioridade mais baixa. Quando não houver chamadas de telepresença, a totalidade da largura de banda estará disponível para VoIP e e-mail. No entanto, havendo uma sessão de telepresença, esta terá prioridade. A rede ainda será capaz de suportar uma quantidade mínima Page 8 de chamadas VoIP e e-mail, através da disponibilidade de espaço durante o processo majoritário. Portanto, todo tráfego será devidamente tratado. Conclusão A performance dos sistemas dependem de diversos fatores. À medida que as aplicações de negócio continuam a crescer em complexidade, dependendo da dispersão geográfica da rede, deve-se considerar que a otimização da WAN melhorará o desempenho de sua rede. Numa rede, há diversas variáveis a se considerar; contudo, se você procura formas de otimizar uma aplicação sobre uma WAN, a latência é o quesito mais importante. A chave para selecionar a tecnologia de WAN mais adequada ao seu negócio é entender os requisitos de suas aplicações e a forma como funciona sua WAN. Mais Informações No Brasil, a Level 3 conta com um serviço de Smart WAN alinhado com o que foi explicado neste White Paper. Além disso, somos o único provedor de dados e telefonia com estrutura de Data Center, serviços de Cloud Computing e conectividade via fibra ótica. Se sua empresa necessitar de algum desses serviços ou se você desejar conhecer mais sobre a Level 3, entre em contato conosco: • 0800-771-4747 • [email protected] • www.level3.com Sobre a Level 3 Communications: A Level 3 Communications, Inc. (NYSE: LVLT) fornece serviços de comunicações locais, nacionais e globais para clientes empresariais, governamentais e para operadoras. O abrangente portfolio de soluções gerenciadas e seguras da Level 3 inclui soluções de fibra e de infraestrutura; comunicações de dados e voz com base em IP; serviços de Ethernet de área ampla; distribuição de vídeo e conteúdo; soluções de data center e de serviços em nuvem. A Level 3 atende clientes em mais de 450 mercados em 45 países através de plataforma global de serviços apoiada em redes de fibra de sua propriedade em três continentes e conectadas através de extensas instalações submarinas. Para mais informações, por favor visite www.level3.com Page 9