UNIVERSIDADE DO VALE DO RIO DOS SINOS - UNISINOS UNIDADE ACADÊMICA DE GRADUAÇÃO CURSO DE SEGURANÇA DA INFORMAÇÃO MARCELO DIEDER UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA PARA A INFRAESTRUTURA DE COMPUTAÇÃO NAS NUVENS UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO São Leopoldo 2012 MARCELO DIEDER UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA PARA A INFRAESTRUTURA DE COMPUTAÇÃO NAS NUVENS UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO Trabalho de Conclusão de Curso apresentado como requisito parcial para a obtenção do título de Tecnólogo em Segurança da Informação na Universidade do Vale do Rio dos Sinos UNISINOS Orientador: Prof. Ms. Jeferson Prevedello São Leopoldo 2012 Dedico totalmente este trabalho para a minha família, que me deu forças para conseguir superar minhas dificuldades e serenidade para continuar a trilhar pelos caminhos obscuros. Aos meus pais e à minha irmã, que desde meus primeiros momentos de vida me transmitiram ensinamentos e caráter de vida, tão importante nesta atual fase da minha vida. Agradeço muito à minha esposa e à minha filha, pelo apoio incondicional que me proporcionaram nos momentos difíceis e que, com simples sorrisos, conseguiam me motivar ainda mais em busca de melhores resultados. AGRADECIMENTOS Primeiramente a Deus, por mostrar-me os melhores caminhos a seguir e à minha família que sempre me acolheu e me aconselhou durante a fase de estudos. Ao meu orientador Jeferson Prevedello, que soube me criticar construtivamente em minhas dúvidas e anseios. . Aos meus colegas de curso, que me possibilitaram a troca de conhecimentos durante todos estes anos de estudo. Ao pessoal das comunidades openstack e openstack-br, que estavam prontamente disponíveis para tirar dúvidas e trocar ideias. Por fim, gostaria de agradecer a todos aqueles que me ajudaram diretamente ou indiretamente no desenvolvimento deste trabalho. "Nossas dúvidas são traidoras e nos fazem perder o que, com frequência, poderíamos ganhar, por simples medo de arriscar." (William Shakespeare) RESUMO O conceito de Computação nas Nuvens é um grande salto tecnológico após o surgimento da Internet. Na necessidade de buscar soluções que possam reduzir custos e agregar mais segurança e desempenho para as aplicações, surge o modelo de entrega de serviços computacionais sob demanda. Por meio de uma pesquisa bibliográfica, este trabalho buscou entender os principais conceitos da computação nas nuvens, seus principais problemas e os limites impostos pela nova tecnologia. A pesquisa também abordou os sistemas de IaaS Eucalyptus e OpenStack, apresentando suas principais características e descrevendo o modelo de arquitetura de cada plataforma. Além disso, utilizando uma abordagem experimental, o sistema OpenStack foi implantando com o intuito de entender melhor o seu funcionamento e obter respostas quanto a seu nível de maturidade atual. A partir da implantação do sistema OpenStack, foi possível entender na prática seu funcionamento, revelando ser uma plataforma robusta e estável, e que pode ser utilizado para orquestrar uma infraestrutura heterogênea que possua um conjunto de diferentes sistemas e equipamentos. Este trabalho também poderá ser utilizado como base para futuros projetos de pesquisa, que buscam o desenvolvimento de uma solução para a computação nas nuvens ou mesmo para corporações que desejam executar seu próprio modelo de nuvem pública ou privada. Palavras-chave: computação nas nuvens, Openstack, serviços sob demanda. ABSTRACT The concept of Computing in the Clouds is a great technological leap after the advent of the Internet. The need to seek solutions that can reduce costs and add more security and performance for applications, the model appears to deliver ondemand computing services. Through a bibliographical survey, this study sought to understand the key concepts of cloud computing, its main problems and the limits imposed by the new technology. The research also addressed the IaaS systems Eucalyptus and OpenStack, presenting their main characteristics and describe the architectural model of every platform. Furthermore, using an experimental approach, the OpenStack system was implemented in order to better understand their operation and get answers about their current maturity level. Upon deployment of the OpenStack, in practice it was possible to understand its operation, proving to be a robust and stable plataform and can be used to orchestrate a heterogeneous infrastructure that has a large set of different systems and equipment. This work may also be used as a basis for future research projects aimed at developing a solution to the cloud, or even for corporations that want to run their own model of public or private cloud. Keywords: cloud computing, openstack, on-demand services. LISTA DE FIGURAS Figura 1 - Arquitetura do modelo de computação nas nuvens ........................ 27 Figura 2 - Camadas da Computação nas Nuvens .......................................... 31 Figura 3 – Visão Global da Computação nas Nuvens. ................................... 33 Figura 4 - Limites entre IaaS, PaaS, SaaS ..................................................... 37 Figura 5 - Pesquisa sobre Computação nas Nuvens ...................................... 41 Figura 6 - Responsabilidades entre modelos computacionais da nuvem ....... 48 Figura 7 - Tipos de arquitetura de virtualização. ............................................. 53 Figura 8 - Arquitetura principal do Eucalyptus. ............................................... 64 Figura 9 - Arquitetura conceitual do Openstack. ............................................. 67 Figura 10- Arquitetura de serviços do Openstack Compute (Nova) ................ 69 Figura 11 - Arquitetura de rede do nova-network. .......................................... 73 Figura 12 - Arquitetura do nova-volume.......................................................... 74 Figura 13 - Fluxograma do processo de decisão do nova-scheduler. ............ 76 Figura 14 - Exemplo de arquitetura do OpenStack Swift. ............................... 78 Figura 15 - Exemplo de anel utilizado no OpenStack Swift. ........................... 80 Figura 16 - Arquitetura lógica do OpenStack Glance. ..................................... 81 Figura 17 - Processo para criação de um serviço validado pelo Keystone. .... 86 Figura 18 - Tela de gerenciamento de instâncias do Horizon. ........................ 88 Figura 19 - Estrutura externa do ambiente proposto. ..................................... 92 Figura 20 - Estrutura externa do ambiente proposto. ..................................... 93 Figura 21 - Gráfico do resultado da análise dos dados de rede. .................... 96 Figura 22 - Gráfico de desempenho das operações de leitura e escrita. ........ 98 LISTA DE QUADROS Quadro 1 - Comparativo de opções de infraestrutura em TI ........................... 28 Quadro 2 - Soluções para gerenciamento de ambientes IaaS. ...................... 59 Quadro 3 - Filtros para utilização no nova-scheduler. .................................... 75 Quadro 4 - Estados de uma imagem no Glance. ............................................ 82 Quadro 5 - Tipos de imagens suportados pelo Glance. .................................. 83 Quadro 6 - Tipos de containers suportados pelo Glance. ............................... 84 Quadro 7 - Comparativo de características entre OpenStack e Eucalyptus. .. 89 Quadro 8 - Requisitos dos servidores para a estrutura................................... 91 Quadro 9 - Gráfico de desempenho das operações de leitura e escrita. ........ 99 LISTA DE TABELAS Tabela 1 - Versões de lançamento do Openstack .......................................... 66 Tabela 2 - Tipos de instâncias pré-definidas pelo EC2. .................................. 77 Tabela 3 - Lista de serviços ativos e inativos do Nova. .................................. 95 Tabela 4 - Tabela do resultado da análise dos dados de rede. ...................... 96 Tabela 5 - Valores de desempenho das operações de leitura e escrita. ........ 97 LISTA DE ABREVIATURAS E SIGLAS AMQP Advanced Message Queuing Protocol API Application Programming Interface ARP Address Resolution Protocol AWS Amazon Web Services CIFS Common Internet Filesystem CLC Cloud Controler SC Storage Controller CC Cluster Controller CMAAS Compliance as a Service CPU Central Processing Unit CSA Cloud Security Alliance DAS Direct Attached Storage DHCP Dynamic Host Configuration Protocol EBS Elastic Block Store EC2 Amazon Elastic Compute Cloud FC Fibre Channel GPL General Public License HP Hewlett-Packard ICMP Internet Control Message Protocol HTTP HyperText Transfer Protocol Secure I/O Input/Output IAAS Infrastructure as a Service IBM International Business Machines IDAAS Identity as a Service IDC International Data Corporation IP Internet Protocol ISCSI Internet Small Computer System Interface JSON Javascript Object Notation KVM Kernel-based Virtual Machine LAN Local Area Network LDAP Lightweight Directory Access Protocol LUN Logical Unit Number 12 LVM Logical Volume Manager LXC Linux Containers MTBF Mean Time Betwenn Failures NAS Network Attached Storage NASA National Aeronautics and Space Administration NBR Normas Brasileiras de Regulação NC Node Controller NFS Network File System PAAS Platform as a Service PATA Parallel Technology Attachment PCI Payment Card Industry PCI DDS PCI Data Security Standard RAID Redundant Array of Independent Disks REST Representational State Transfer S3 Amazon Simple Storage Service SAAS Software as a Service SAN Storage Area Network SAS Serial Attached SCSI SAS 70 Statement on Auditing Standards No. 70 SATA Serial Advanced Technology Attachment SC Storage Controller SCSI Small Computer System Interface SPI SaaS PaaS IaaS SSH Secure Shell STAAS Storage as a Service TCP Transmission Control Protocol TCP/IP Transmission Control Protocol / Internet Protocol TI Tecnologia da Informação UML User Mode Linux VLAN Virtual Lan VM Virtual Machine VMM Virtual Machine Monitor VNC Virtual Network Computing 13 VPN Virtual Private Network XFS High-Performance Journaling File System XML Extensible Markup Language SUMÁRIO 1 INTRODUÇÃO ....................................................................................................... 18 1.1 DEFINIÇÃO DO PROBLEMA.............................................................................. 18 1.2 OBJETIVOS ........................................................................................................ 21 1.2.1 Objetivo Geral ................................................................................................. 21 1.2.2 Objetivos Específicos .................................................................................... 21 1.3 JUSTIFICATIVA .................................................................................................. 22 1.4 DELIMITAÇÃO DO TEMA ................................................................................... 23 2 FUNDAMENTAÇÃO TEÓRICA ............................................................................. 25 2.1 COMPUTAÇÃO NAS NUVENS .......................................................................... 26 2.1.1 Características do Modelo Computacional em Nuvem ............................... 27 2.1.2 A Importância da Virtualização e o Armazenamento Centralizado ............ 31 2.1.3 O Modelo Computacional da Computação nas Nuvens ............................. 32 2.1.4 Principais Conceitos ...................................................................................... 33 2.1.5 Arquiteturas .................................................................................................... 35 2.1.5.1 Público........................................................................................................... 35 2.1.5.2 Privado .......................................................................................................... 35 2.1.5.3 Comunitário ................................................................................................... 36 2.1.5.4 Híbrido ........................................................................................................... 36 2.1.6 Tipos de Serviço ............................................................................................. 36 2.1.6.1 Infraestrutura como um Serviço .................................................................... 38 2.1.6.2 Plataforma como um Serviço ........................................................................ 39 2.1.6.3 Software como um Serviço ............................................................................ 39 2.2 A SEGURANÇA E OS LIMITES DA COMPUTAÇÃO NAS NUVENS ................. 40 2.2.1 Principais Preocupações ............................................................................... 41 2.2.2 Limites da nuvem ........................................................................................... 42 2.2.2.1 Confidencialidade das informações ............................................................... 43 2.2.2.2 Disponibilidade de serviços ........................................................................... 43 2.2.2.3 Tipos de aplicações ....................................................................................... 44 2.2.2.4 Conformidade com a legislação vigente ........................................................ 44 2.2.2.5 Multi-Inquilino ................................................................................................ 45 2.2.2.6 Dependência do fornecedor .......................................................................... 46 2.2.3 Cloud Security Alliance ................................................................................. 46 15 2.3 VIRTUALIZAÇÃO ................................................................................................ 49 2.3.1 Vantagens ....................................................................................................... 50 2.3.2 Desvantagens ................................................................................................. 50 2.3.3 Virtual Machine Monitor ................................................................................. 51 2.3.4 Soluções de Virtualização ............................................................................. 53 2.3.4.1 Kernel-based Virtual Machine ....................................................................... 54 2.3.4.2 Qemu............................................................................................................. 54 2.3.4.3 Xen ................................................................................................................ 54 2.3.4.4 Vmware ESX ................................................................................................. 55 2.3.4.5 Virtualbox ...................................................................................................... 55 2.4 O ARMAZENAMENTO DE DADOS .................................................................... 55 2.4.1 Direct Attached Storage................................................................................. 56 2.4.2 Network Attached Storage............................................................................. 56 2.4.3 Storage Area Network .................................................................................... 56 3 SOLUÇÃO PARA GERÊNCIA DA INFRAESTRUTURA DA NUVEM .................. 58 3.1 ORQUESTAR O AMBIENTE DA NUVEM ........................................................... 58 3.2 SOLUÇÕES DE IAAS EXISTENTES .................................................................. 58 3.2.1 Amazon Web Services ................................................................................... 59 3.2.2 Nimbus ............................................................................................................ 60 3.2.3 OpenNebula .................................................................................................... 60 3.2.4 Eucalyptus ...................................................................................................... 61 3.2.5 OpenStack....................................................................................................... 61 3.2.6 Análise Parcial das Soluções ........................................................................ 62 3.3 EUCALYPTUS .................................................................................................... 63 3.3.1 Principais Componentes ............................................................................... 63 3.3.1.1 Cloud Controller (CLC) .................................................................................. 64 3.3.1.2 Walrus ........................................................................................................... 64 3.3.1.3 Cluster Controller (CC) .................................................................................. 64 3.3.1.4 Storage Controller (SC) ................................................................................. 65 3.3.1.5 Node Controller (NC) ..................................................................................... 65 3.3.1.6 VMware Broker .............................................................................................. 65 3.3.1.7 Euca2ools...................................................................................................... 65 3.4 OPENSTACK ...................................................................................................... 66 16 3.4.1 Visão Global.................................................................................................... 67 3.4.2 Openstack Compute (Nova) .......................................................................... 68 3.4.2.1 API Server (nova-api) .................................................................................... 70 3.4.2.2 Message Queue (Rabbit MQ Server) ............................................................ 71 3.4.2.3 Compute Worker (nova-compute) ................................................................. 71 3.4.2.4 Network Controller (nova-network) ................................................................ 71 3.4.2.5 Volume Workers (nova-volume) .................................................................... 73 3.4.2.6 Nova Objectstore (nova-objectstore) ............................................................. 74 3.4.2.7 Scheduler (nova-scheduler) .......................................................................... 74 3.4.2.8 Tipos de Instâncias (Flavors) ........................................................................ 76 3.4.3 Openstack Storage Infrastructure (Swift)..................................................... 77 3.4.3.1 Swift Proxy Server ......................................................................................... 78 3.4.3.2 Swift Object Server ........................................................................................ 78 3.4.3.3 Swift Container Server................................................................................... 79 3.4.3.4 Swift Account Server ..................................................................................... 79 3.4.3.5 The Ring ........................................................................................................ 79 3.4.4 Openstack Imaging Service (Glance) ........................................................... 81 3.4.4.1 Glance-api ..................................................................................................... 82 3.4.4.2 Glance-registry .............................................................................................. 83 3.4.4.2 Formato de Discos e Containers ................................................................... 83 3.4.5 OpenStack Identity Service (Keystone) ........................................................ 84 3.4.5.1 Base de Dados .............................................................................................. 86 3.4.6 Openstack Administrative Web-Interface (Horizon) .................................... 86 3.5 ANÁLISE DO EUCALYPTUS E OPENSTACK.................................................... 88 4 PROJETO PRÁTICO E RESULTADOS OBTIDOS ............................................... 90 4.1 AMBIENTE DA PROPOSTA DE TRABALHO ..................................................... 90 4.1.1 Requisitos da infraestrutura .......................................................................... 91 4.1.2 Arquitetura do ambiente ................................................................................ 91 4.1.3 Processo de Instalação.................................................................................. 93 4.2 COLETA DE DADOS DO AMBIENTE ................................................................. 94 4.2.1 Testes de Latência de Rede X Testes de Troca de Tráfego ........................ 94 4.2.2 Testes de Leitura e Gravação de Dados ....................................................... 94 4.2.3 Simulação de falhas nos serviços do Nova ................................................. 95 17 4.3 ANÁLISE DOS DADOS OBTIDOS ...................................................................... 95 4.3.1 Da latência e desempenho da rede ............................................................... 95 4.3.2 Da latência e velocidade das operações de disco ...................................... 96 4.3.3 Da análise da disponibilidade dos componentes ........................................ 98 5 CONCLUSÃO ...................................................................................................... 100 REFERÊNCIAS ....................................................................................................... 103 APÊNDICE A .......................................................................................................... 111 18 1 INTRODUÇÃO Computação nas Nuvens é um dos principais assuntos no atual momento da Tecnologia da Informação. A Computação nas Nuvens traz consigo conceitos de entrega de tecnologia como um serviço computacional, da mesma forma que serviços como água e a eletricidade, entregando-os sob demanda. Computação nas Nuvens não é uma nova tecnologia ou um novo sistema computacional, é uma nova maneira de utilização de recursos computacionais de forma distribuída e descentralizada, utilizando como meio de transporte, principalmente, a Internet. Pode-se utilizar a nuvem para o armazenamento e processamento de informações, de forma escalável e sob a demanda necessária, ou seja, conforme aumenta a necessidade de processamento e cresce o volume de informações, pode-se dinamicamente alocar mais recursos computacionais, conforme necessário. Observa-se, desta maneira, que ao invés de investir-se em uma infraestrutura computacional completa, repleta de ativos computacionais, pode-se focar em investimento de serviços. Neste caso, o custo é apenas dos recursos utilizados, além de reduzir as despesas com infraestrutura. Nem sempre a utilização de serviços sob demanda pode ser vantajoso, isso pode depender do tipo de aplicação e da demanda necessária para atender a determinados requisitos. Também é importante salientar que na nuvem não se sabe onde está a informação, ou onde ela será processada, mas é essencial que a informação esteja íntegra e sempre disponível. Este trabalho está dividido em cinco capítulos. No primeiro capítulo será realizada a introdução do tema a ser abordado. No capítulo dois, é apresentada uma fundamentação teórica dos assuntos relacionados. No capítulo três, são descritas as soluções de gerenciamento da nuvem. No capítulo quatro, será descrito a implantação do projeto. E por fim, no capítulo cinco, será realizada a conclusão do tema. 1.1 DEFINIÇÃO DO PROBLEMA Com o avanço do conceito de tecnologia em nuvem, diversas soluções surgiram para orquestrar diferentes tipos de plataformas e serviços, mas sem que 19 houvesse uma definição exata de um modelo estruturado que garantisse a padronização desta nova arquitetura. De acordo com pesquisa realizada em 2011 com 500 organizações, encomendada pela Symantec Corporation sobre a situação da Cloud Computing na América Latina, SYMANTEC (2011), foi possível apontar quatro principais preocupações que as organizações possuem quanto à utilização da Cloud, conforme é possível observar a seguir: segurança das Informações; falta de experiência de equipes de TI; diferentes tipos de soluções e ausência de testes efetivos na nuvem; retorno sobre investimento abaixo do esperado. É possível observar que a pesquisa apresenta dados concretos sobre algumas das dificuldades das corporações utilizarem a nova tecnologia, principalmente pelas dúvidas quanto à segurança dos dados e pela falta de experiência de equipes, juntamente com os diferentes tipos de tecnologias para enviar os dados para a nuvem. O caminho para a utilização de Cloud Computing passa pelos conceitos de virtualização e de armazenamento de informação centralizado, que são essenciais para o desenvolvimento da plataforma descentralizada. Atualmente, existem diversas soluções que podem realizar a virtualização de máquinas, assim como também existem diversos tipos de sistemas de armazenamento disponíveis. As grandes dificuldades estão em garantir a integração entre os diferentes tipos de sistemas, em efetuar o gerenciamento do ambiente heterogêneo e, também, de possibilitar a migração dos dados entre eles de forma rápida e funcional. Além disso, a preocupação com a segurança dos dados na nuvem é outro fator impeditivo para várias corporações, ao analisarem o risco na utilização de suas informações na nuvem. Em um ambiente de nuvem que fornece infraestrutura, como máquinas virtuais e espaço de alocação de dados, toda essa gerência é executada pelo chamado Cloud Controler, o controlador de recursos da nuvem1. Atualmente existem inúmeras plataformas controladoras, sejam elas do modelo de código aberto ou 20 mesma de código fechado. O grande esforço destas plataformas é garantir a interoperabilidade com os diferentes tipos de hypervisors2, storages3, redes de comunicação e as API (Application Programming Interface)4 de integração, de modo que as corporações possam percorrer pelos diferentes tipos de tecnologias de forma rápida e facilitada. No cenário atual, podemos citar com destaque as operações realizadas pelos fornecedores Amazon5 e Rackspace6, duas das principais empresas mundiais que providenciam serviço de infraestrutura na nuvem. Das soluções existentes, que possibilitam que empresas públicas e privadas tenham sua própria nuvem, pode-se citar inúmeras aplicações, sejam elas de código fechado ou aberto. A Citrix Systems oferece uma solução proprietária de gerenciamento de infraestrutura chamado CloudStack, que apresenta integração com múltiplos tipos de sistemas. A Vmware Inc, possui uma solução proprietária conhecida como vCloud, porém gerencia apenas suas próprias aplicações de virtualização. Entre as soluções de código aberto, também é possível apresentar várias aplicações, dentre as quais são possíveis citar o OpenNebula, Nimbus, OpenStack e o Eucalyptus (disponibiliza versão aberta e proprietária). Entretanto, apesar da grande oferta de aplicações existentes, vários padrões foram desenvolvidos, dificultando a comunicação harmoniosa entre os diferentes tipos de sistemas. As soluções de plataforma fechada tendem a ditar “as regras do jogo”, buscando sempre os interesses do próprio negócio. Do contrário, as soluções de código aberto buscam atender aos interesses de todos os envolvidos no projeto, aumentando, consequentemente, a interoperabilidade entre diferentes sistemas, e atribuindo o controle do projeto para todos os seus participantes. A nuvem é um ambiente complexo e heterogêneo, e necessita de colaboração mútua entre todos os personagens deste sistema. Diante deste cenário, é possível delinear a definição do problema: É possível que uma plataforma de software aberto, no esforço de seus colaboradores mundiais, consiga apresentar uma solução segura e eficaz, que possa controlar e gerenciar a infraestrutura de diferentes soluções de virtualização e de armazenamento de forma 1 Conhecido também como IaaS ( Infrastructure as a Service) – Tipo de serviço oferecido na nuvem. Hypervisor – Camada de software que realiza a virtualização de máquinas virtuais. 3 Storage – Equipamento de armazenamento de dados centralizado. 4 API – Interface para comunicação entre vários tipos de sistemas. 5 Amazon – Empresa multinacional de comercio eletrônico com base nos EUA. 2 21 a oferecer serviços de IaaS, além de agregar maior segurança para a computação nas nuvens? 1.2 OBJETIVOS Serão descritos a seguir, os objetivos geral e específicos deste trabalho, de modo a esclarecer o escopo do trabalho. 1.2.1 Objetivo Geral Este trabalho terá como objetivo geral a descrição das terminologias que envolvem a Computação nas Nuvens, a apresentação dos resultados qualitativos obtidos a partir do comparativo com entre o OpenStack e o Eucalyptus, e da implantação de um ambiente da nuvem utilizando o projeto de código aberto Openstack. 1.2.2 Objetivos Específicos - Apresentar e descrever os modelos e a arquitetura que envolve a computação nas nuvens, evidenciando os principais benefícios de sua utilização e seus principais riscos. - Identificar os componentes que formam o projeto Openstack, apresentando detalhadamente quais são suas responsabilidades e atribuições, e quais os níveis de maturidade destes componentes. - Apresentar os resultados obtidos da implantação de uma infraestrutura de nuvem, utilizando o projeto Openstack, salientando, também, questões de desempenho, de confiabilidade, integridade e disponibilidade. - Através de pesquisas, apresentar a descrição dos componentes da aplicação Eucalyptus e uma tabela comparativa com as principais funcionalidades, capacidades e limites dos projetos Openstack e Eucalyptus. 6 Rackspace – Empresa multinacional provedora de serviços de TI, com base nos EUA. 22 1.3 JUSTIFICATIVA O poder de cálculo dos atuais processadores, associado a grande evolução das mídias de armazenamento de informações, despontou a tecnologia de virtualização, possibilitando o aproveitando de recursos ociosos, reduzindo custos de infraestrutura, além de aumentar a disponibilidade dos sistemas e garantir aumentos de produtividade. A partir da propulsão da virtualização, com seus múltiplos hypervisors e de diferentes fabricantes, emerge a necessidade de um gerenciador central que tivesse o papel de integrar diferentes soluções; surgindo, assim, a computação nas nuvens. De acordo com Velte Ant; Velte Tob et al (2011,p.3), a computação em nuvem (Cloud Computing) está em toda parte. Abra qualquer revista de tecnologia ou visite qualquer site ou blog e certamente você verá alguma matéria sobre cloud computing. O único problema é que nem todos concordam com o que isso significa. Pergunte a dez profissionais diferentes o que é cloud computing e você obterá dez respostas distintas. Segundo a definição sobre nuvem de SCHUBERT et al (2010,p.8, tradução nossa), “a nuvem é uma execução elástica de recursos envolvendo múltiplos interessados e que provêm um serviço medido através de múltiplas granularidades para um nível de serviço adequado.” Existem diversos trabalhos publicados com o propósito de explicar a conceituação da computação nas nuvens, exaltando as principais características e evidenciando os problemas existentes da utilização de uma estrutura na nuvem. A proposta de Miranda et al. (2011), consiste em realizar o compartilhamento e estudo de grandes volumes de dados biológicos, utilizando processamento paralelo de uma Cloud, porém, não foca na descrição de uma solução para o gerenciamento do ambiente. Já o artigo de Nurmi et al. (2009) realiza a descrição da solução opensource Eucalyptus, apresentando a conceituação da Cloud e demonstrando a arquitetura interna do sistema, mas não traça um comparativo com demais soluções. Sotomayor et al. (2009), procura realizar um comparativo entre as principais soluções de administração do ambiente de Cloud Computing, destacando soluções como Amazon EC2, Nimbus, Eucalyptus, OpenNebula, entre outros, mas seu estudo não aprofunda em questões internas de cada aplicação. O trabalho de Delgado (2010) descreve detalhadamente a conceituação da nuvem, apresenta o Eucalyptus, 23 e demonstra testes de desempenho realizados no ambiente controlado por ele, entretanto seus testes são focados, em sua maioria, nos sistemas de virtualização e não na plataforma da nuvem. O critério para a escolha pela implantação da solução Openstack ocorreu, pois não foram localizados trabalhos acadêmicos com comparativos entre o OpenStack e outras ferramentas de gerência da infraestrutura da nuvem. Além disso, a comparação com o Eucalyptus ocorrerá por ele ser uma plataforma estável e totalmente compatível com os serviços de nuvem oferecidos pela Amazon (Eucalyptus Systems, 2012a). Academicamente, o termo Cloud Computing é tema de diversos trabalhos, no entanto, também existem carências de trabalhos com foco no desenvolvimento e apresentação de soluções que possam gerenciar um ambiente complexo e heterogêneo como a nuvem. Enquanto a virtualização assume sua importância nos pilares da nuvem, existe, também, a necessidade de uma solução neutra, sem vínculos comerciais, capaz de gerenciar ambientes heterogêneos na nuvem e ser utilizada por pequenas, médias e grandes corporações. Dentro desta realidade, este trabalho justifica-se pela necessidade de um estudo que possa expor de uma forma clara, as definições sobre cloud computing e que relate como o projeto Openstack pode ajudar a viabilizar infraestrutura de nuvens públicas e privadas. 1.4 DELIMITAÇÃO DO TEMA Este estudo irá focar nas terminologias envolvendo a computação em nuvem, apresentando e descrevendo seus principais conceitos. Também apresentará o projeto Openstack, circunstanciando seus componentes e sua arquitetura de comunicação e também apresentará um análise comparativa entre as soluções OpenStack e Eucalyptus. A partir de um piloto prático, este trabalho irá realizar a instalação dos componentes Nova e Glance do OpenStack, irá apresentar a arquitetura do ambiente implantado e descreverá os testes realizados nos componentes. Ao final, a partir da coleta de dados, disponibilizará resultados qualitativos e quantitativos da solução implantada. Este trabalho não irá focar na integração com equipamentos de armazenamento centralizados, na implantação prática da aplicação Eucalyptus e 24 durante a implantação do projeto dará ênfase apenas ao emulador QEMU, não utilizando demais sistemas de virtualização. 25 2 FUNDAMENTAÇÃO TEÓRICA Este capítulo descreverá a conceituação de Computação nas Nuvens, apresentando suas principais características, modelos de arquiteturas, suas limitações, informando, também, suas principais vantagens e desvantagens, salientando no decorrer do texto, como ocorreu a evolução natural deste modelo computacional. O capítulo também apresentará a definição de virtualização e armazenamento de dados centralizados, e como eles estão ligados diretamente com a computação nas nuvens. Para a elaboração deste trabalho realizou-se o levantamento bibliográfico por meio de livros e artigos científicos que abordam sobre o tema apresentado no trabalho, além de sites de soluções utilizadas para a computação nas nuvens e que são reconhecidas na sua área de atuação. A elaboração dessa etapa foi fundamental para oferecer sustentação à pesquisa experimental realizada para a conclusão deste estudo. Ander-Egg (1978, apud Lakatos; Marconi, 2002, p. 15), afirma que a pesquisa é caracterizada por “um procedimento reflexivo sistemático, controlado e crítico, que permite descobrir novos fatos ou dados, relações ou leis, em qualquer campo do conhecimento”. Lakatos e Marconi (2002) ainda acrescentam que a pesquisa é considerada um caminho em busca do descobrimento da realidade e de verdades parciais, e, devido a isto, torna-se necessário um tratamento científico. A metodologia escolhida para a elaboração deste trabalho monográfico foi de pesquisa bibliográfica e experimental. A pesquisa bibliográfica, de acordo com Manzo (1971, apud Lakatos; Marconi, 2002, p. 71), “oferece meios para definir, resolver, não somente problemas conhecidos, como também explorar novas áreas onde os problemas não se cristalizam suficientemente” Trujillo (1974, apud Lakatos; Marconi, 2002, p. 71) complementa esta afirmação quando diz que a pesquisa bibliográfica “não é mera repetição do que já foi dito ou escrito sobre certo assunto, mas propicia o exame de um tema sob novo enfoque ou abordagem, chegando a conclusões inovadoras”. 26 2.1 COMPUTAÇÃO NAS NUVENS Computação nas Nuvens, ou Cloud Computing é um novo modelo computacional que busca principalmente a redução de custos e o aumento de produtividade. A definição de Velte Ant; Velte Tob et al (2011,p.3) sobre cloud é que “a função da computação em nuvem (cloud computing) é cortar custos operacionais e o mais importante, permitir que departamentos de TI se concentrem em projetos estratégicos em vez de manter o data center funcionando”. O futuro da Cloud Computing pode ser comparado com a história da energia elétrica. Segundo Miller (2008, p.8, tradução nossa), O surgimento da computação em nuvem é o equivalente à revolução da energia elétrica do século passado. Antes do episódio de utilitários elétricos, cada fazenda e empresa de negócios produzia sua própria eletricidade a partir de geradores autônomos. Após a criação da rede elétrica, fazendas e empresas desativaram seus geradores e a energia elétrica foi comprada dos serviços públicos a um preço muito menor (e com confiabilidade muito maior) do que poderiam produzir por conta própria. Olhe para o mesmo tipo de revolução que ocorre com a computação em nuvem. De acordo com a definição do Nist7 (2011, p.2, tradução nossa), Computação nas Nuvens é, um modelo para permitir a onipresença, conveniente, o acesso à rede sob demanda para um pool compartilhado de recursos computacionais configuráveis (por exemplo, redes, servidores, armazenamento, aplicativos e serviços) que podem ser rapidamente fornecidos e liberados com o esforço de gerenciamento mínimo ou interação com o provedor de serviço. A arquitetura computacional do modelo da Cloud Computing evoluiu ao longo dos anos, a partir de outros modelos computacionais existentes, como o modelo cliente-servidor, o modelo peer-to-peer 8, o modelo computacional distribuído, e o modelo grid de trabalho em grupo. Miller (2008) A nuvem utiliza-se de características de todos os modelos citados anteriormente, mas assemelha-se principalmente ao modelo computacional de Sistemas Distribuídos, onde várias máquinas trabalham em conjunto. Segundo Tanenbaum (1995, p.2, tradução nossa), “um sistema distribuído é uma coleção de 7 8 NIST - U.S. National Institute of Standards and Technology Peer-to-Peer – Tipo de arquitetura de um sistema distribuído. 27 computadores independentes, que aparecem para um usuário de um sistema como um único computador”. A figura 1, abaixo apresentada, ilustra o modelo computacional da Cloud Computing. Figura 1 - Arquitetura do modelo de computação nas nuvens Fonte: Editado pelo autor com base em Miller (2008, p. 16) Conforme Miller (2008, p. 16, tradução nossa), usuários individuais conectam na nuvem a partir de seus próprios computadores pessoais ou aparelhos portáteis, através da Internet. Para estes usuários individuais, a nuvem é vista como uma única aplicação, documento ou dispositivo. O hardware na nuvem (e do sistema operacional que gerencia as conexões de hardware) é invisível. 2.1.1 Características do Modelo Computacional em Nuvem A utilização do módulo computacional em nuvem, é conduzido pelas corporações em sua grande maioria, quando o objetivo principal é a redução de custos com infraestrutura. Entretanto, a cloud possibilita que corporações, ou até mesmo usuários finais, possam se beneficiar de outras características positivas que este modelo proporciona. Miller (2008, p. 24, tradução nossa) cita diversas vantagens da Cloud Computing: 28 baixo custo com a aquisição de computadores para usuários; aumento de desempenho; baixo custo com infraestrutura de Tecnologia da Informação; menor custo para manutenções de hardware e software; menor custo aquisição de software; atualização instantânea de sistemas; aumento de poder de processamento; capacidade de armazenamento ilimitada; aumento de segurança no armazenamento de informações; Aumento de compatibilidade entre sistemas distintos. As características citadas são vantagens que usuários finais ou corporações podem usufruir, não só reduzindo o custo, como também agregando maior qualidade aos serviços utilizados da TI. De acordo com o quadro de Reese (2009) apresentado a seguir, é possível observar o comparativo qualitativo entre uma solução em nuvem e duas opções comumente utilizadas pelas corporações para manter sua infraestrutura de TI. A primeira e mais clássica, é a utilização de uma infraestrutura interna onde a própria corporação é responsável por manter o capital físico e o capital humano. A segunda opção é a utilização de um serviço terceirizado, onde previamente existe um acordo mútuo entre a empresa contratante e a empresa contratada, de forma que possam delimitar as atribuições de cada um. A empresa terceirizada é responsável por manter toda a infraestrutura física, inclusive os serviços por ela prestados. Por fim, é ilustrada a utilização de serviços na nuvem, onde claramente se pode observar uma mescla de vantagens entre a opção de “TI Interna” e “Serviços Terceirizados”. Quadro 1 - Comparativo de opções de infraestrutura em TI Investimento de Capital Despesas Tempo de Provisionamento Flexibilidade Requisitos de Experiência Equipe Confiança TI Interna Serviços Tercerizados Computação nas Nuvens Significante Moderado Insignificante Moderado Significante Baseado na utilização Significante Moderado Nenhum Limitado Moderado Flexível Significante Limitado Moderado Varia Alto Moderado para Alto Fonte: Editado pelo autor com base em Reese (2009, p. 12) 29 Ao mesmo tempo em que a Computação nas Nuvens pode reduzir o investimento de capital inicial para novos projetos de TI, diminui-se o tempo de provisionamento para novas instalações e aumenta-se a flexibilidade da infraestrutura de TI. Na opção pela nuvem, também é possível observar a necessidade de manter-se uma equipe de TI com experiência para que seja possível a integração entre sistemas internos e os sistemas alocados fora da empresa. Quanto à confiança da utilização dos serviços na nuvem, o que pode se observar é um acréscimo de segurança da infraestrutura, afinal provedores de soluções em nuvem utilizam de uma forma geral equipamentos redundantes e equipes especializadas e dedicadas em regime de tempo de 24x7x365. Além disso, operam de acordo com normatizações de segurança tais como a Statement on Auditing Standards Nº. 70 (SAS 70) 9, Payment Card Industry - Data Security Standard (PCI DSS) 10 e a ISO IEC 27001 11. Segundo Reese (2009, p. 9, tradução nossa), a nuvem necessariamente precisa ter um Mean Time Between Failures (MTBF)12 maior que uma estrutura interna, um desafio fundamental para qualquer sistema que exige longa vida de nós em uma infraestrutura de nuvem, é o fato básico de que o tempo médio entre falhas (MTBF) de um servidor virtual é necessariamente menor do que para o hardware subjacente. Desta maneira, pressupõe-se que uma infraestrutura na Cloud, terá um MTBF sempre maior que uma estrutura interna, afinal ela possui uma estrutura grande o suficiente para reduzir o número de falhas em equipamentos por meio da utilização de equipamentos redundantes e trabalhando cooperativamente. Velte Ant; Velte Tob et al. (2011, p. 30), também observa que a cloud computing pode oferecer diversos benefícios. Ele cita a escalabilidade, prevendo um crescimento futuro; a simplicidade do ambiente, permitindo que novos ambientes de infraestrutura estejam disponíveis de imediato; o aumento na qualidade dos serviços, afinal os fornecedores são qualificados para a realização de suas tarefas, e o 9 SAS 70 - Certificação que visa o controle e utilização de melhores práticas para empresas de prestação de serviços. http://sas70.com/sas70_overview.html 10 PCI DSS – Padrão de segurança de dados do setor de cartões de pagamento. https://www.pcisecuritystandards.org 11 ISO/IEC 27001 - Norma padrão para um sistema de gestão da segurança da informação. http://www.iso27001security.com/html/27001.html 30 aumento de segurança das soluções utilizadas, na medida em que os fornecedores possuem políticas de privacidade rigorosas que garantem, possivelmente, mais segurança do que na própria TI local. Apesar dos benefícios que ambientes da nuvem podem proporcionar, nem tudo é vantajoso. Além das vantagens, Miller (2008, p. 24, tradução nossa) também cita algumas desvantagens na sua utilização: necessidade constante de conexão à internet; desempenho ruim com conexões de internet lenta; mesmo em conexões rápidas, algumas aplicações podem ser mais lentas, quando comparadas com uma execução em um computador local; limitações de determinados tipos de aplicações; insegurança quanto à confidencialidade de informações; indisponibilidade dos dados na eventual falha de um provedor de serviços na nuvem. A nuvem pode não ser a solução ideal para determinado perfil de empresa ou usuário. Conforme o comparativo de Reese apresentando anteriormente, os custos com a Cloud podem ser, inclusive, maiores se comparado a uma infraestrutura interna. A partir destas definições, as desvantagens citadas por Miller, como a incerteza na confidencialidade dos dados, podem inibir a ascensão da Cloud. Entretanto, as desvantagens da utilização desta nova arquitetura não devem interromper o seu crescimento, de acordo com pesquisas realizadas. Segundo estudo realizado pelo IDC (2010)13, a previsão de crescimento da nuvem será de 27% por ano, entre 2009 até 2014. As corporações que pretendem fornecer serviços na nuvem, precisarão se posicionar de uma forma agressiva até o ano de 2013, para que não fiquem de fora do mercado. 12 13 MTBF – Cálculo utilizado para verificar o período médio entre falhas de um determinado dispositivo. International Data Corporation – Empresa que realiza pesquisas de mercado. http://www.idc.com 31 2.1.2 A Importância da Virtualização e o Armazenamento Centralizado A nuvem surgiu a partir do desenvolvimento e amadurecimento de soluções como a virtualização e o armazenamento centralizado. A tecnologia de virtualização permite que um hardware físico possa ser utilizado para instalação de diversas máquinas virtuais. A tecnologia de armazenamento centralizado permite unificar todas as informações em redes de armazenamento, simplificando a administração e aumentando a flexibilidade para a alocação de dados. É possível analisar na figura a seguir, que a nuvem está apoiada sob ambientes de virtualização e de armazenamento centralizado, ainda que a utilização destas soluções não seja obrigatória. Figura 2 - Camadas da Computação nas Nuvens Fonte: Editado pelo autor com base em IBM (2011) A virtualização é um dos pilares da Computação nas Nuvens, afinal ela possibilita uma melhor utilização de recursos computacionais, por meio da criação de diversos ambientes virtuais em máquinas físicas. Com a técnica da virtualização, é possível executar diversos sistemas operacionais de diferentes fabricantes em um mesmo servidor físico. Isso garante o aproveitamento máximo da utilização de processamento, memória e armazenamento de servidores, diminui 32 consideravelmente o tempo com o gerenciamento e instalação de novos sistemas, além de reduzir custos com a administração do ambiente tecnológico e da aquisição de equipamentos físicos. O armazenamento de dados é um item indispensável para a Cloud Computing. É neste pilar que se situam as maiores dúvidas quanto a segurança e disponibilidade de dados. Na nuvem, todos os dados estão armazenados em diferentes locais, garantindo, assim, que as informações possam ser acessadas a qualquer momento e de qualquer lugar. Os dados podem estar alocados em diferentes tipos de sistemas de armazenamento, sejam eles equipamentos dedicados como storages, servidores, ou redes de armazenamento conhecidos como SAN (Storage Area Network). Um sistema robusto de gerenciamento é necessário para garantir a disponibilidade e o controle adequado das informações. 2.1.3 O Modelo Computacional da Computação nas Nuvens O modelo computacional da computação nas nuvens está dividido em conceitos, tipos de serviços e tipos de arquitetura. Este modelo computacional é essencial para o entendimento de como tudo funciona e, naturalmente, vem se adaptando aos novos conceitos, funcionalidades e arquiteturas. De acordo com MELL; GRANCE (2008, apud Sosinsky, 2011, p. 63), a nuvem é classificada em quatro tipos de arquiteturas, três modelos de serviço e, também, cinco principais conceitos sobre o funcionamento da cloud. Esta definição, criada originalmente pelo NIST, define as arquiteturas da nuvem em modelo comunitário, híbrido, privado e público. Também classifica os tipos de serviço em IaaS (Infrastructure as a Service), PaaS (Platform as a Service) e SaaS (Software as a Service). Por fim, define os cinco conceitos principais como conjunto de recursos, acesso amplo à rede, serviço medido, serviço sob demanda e rápida elasticidade. Conforme a figura apresentada a seguir, é possível observar a classificação acima descrita. 33 Figura 3 – Visão Global da Computação nas Nuvens. Fonte: Editado pelo autor com base em Sosinsky (2011). 2.1.4 Principais Conceitos Com base no descritivo apresentado por Sosinsky e definido pelo NIST, é possível descrever os conceitos da Computação nas Nuvens. Pool de Recursos: o Pool de Recursos está associado à quantidade de recursos computacionais que estarão disponíveis para os usuários finais, como a quantidade de processamento, memória e espaço de armazenamento. Com a definição da quantidade de recursos disponíveis, pode-se definir quanto será destinado para cada situação, e quando serão compartilhados. Os recursos podem ser compartilhados entre diversos usuários ao mesmo tempo, modo conhecido como multi-inquilino. Além disso, estes recursos podem estar geograficamente espalhados, porém de forma transparente para os usuários finais. Por exemplo, se pode definir um Pool de Recursos para um determinado grupo de usuários domésticos e outro para usuários corporativos. Sosinsky (2011, p. 63) Serviços Sob Demanda: conhecido também como “on-demand”, o conceito de serviço sob demanda define como serão utilizados os 34 serviços da nuvem. Assim como ocorre com outros serviços sob demanda, como o consumo de água e eletricidade, os serviços tecnológicos da cloud são utilizados conforme a necessidade, e são alocados dinamicamente, de acordo com o crescimento da demanda. Dessa forma, o custo total é a soma de todos os recursos utilizados em determinado período. Isto possibilita que aplicações cresçam dinamicamente, alocando automaticamente mais recursos sem que seja necessário mudanças na infraestrutura local. Sosinsky (2011, p. 63) Elasticidade e Escalabilidade: a elasticidade e a escalabilidade estão vinculadas diretamente com o pool de recursos e os serviços sob demanda. Estes conceitos garantem a possibilidade de crescer gradativamente o ambiente tecnológico para cada tipo de necessidade de forma automática ou manual. Em uma demanda inicial, pode-se utilizar X ciclos de processamento, memória e armazenamento, e estes ciclos podem aumentar dinamicamente conforme a necessidade. Do ponto de vista do cliente, os recursos podem ser adquiridos em qualquer quantidade e em qualquer momento. Sosinsky (2011, p. 63) Serviço Medido: os recursos utilizados pelo usuário em determinado período são mensurados, de forma que seja possível a identificação da quantidade memória, CPU, I/O (Input/Output) de disco, ou utilização da rede que foram de fato consumidos. A partir deste relatório, o usuário é tarifado, baseado nas métricas de utilização. Sosinsky (2011, p. 64) Acesso Amplo à Rede: capacidade da rede possuir arquiteturas heterogêneas, de modo que diversos dispositivos como celulares, tablets, laptops e desktops possam acessar o ambiente em qualquer local e a qualquer momento. Sosinsky (2011, p. 63) 35 2.1.5 Arquiteturas Podemos classificar os modelos de arquitetura da nuvem em quatro principais tipos. Não há um modelo que tenha vantagem sobre outro, a utilização destes modelos vai depender da necessidade de cada corporação, questões de custo, necessidades regulatórias, ou questões de segurança da informação. 2.1.5.1 Público O modelo público é aquele em que a nuvem tem os seus recursos compartilhados entre o público geral. Apesar de existir uma divisão lógica que garanta a separação entre todos os usuários, sua infraestrutura física é a mesma para todos (Sosinsky, 2011, p. 48). De pontos positivos, é possível citar o baixo custo e a grande quantidade de oferta no mercado. Como aspecto negativo, é possível relatar problemas de desempenho e segurança das informações quanto a sua confidencialidade e disponibilidade, afinal, todos os dados estão alocados em meios de armazenamento compartilhados. 2.1.5.2 Privado O modelo privado, diferentemente do modelo público, é exclusivo de um usuário ou um grupo. Ele pode estar situado dentro de uma corporação ou pode estar alocado em um terceiro que garanta a sua utilização exclusiva. Este modelo assegura que a infraestrutura será de uso dedicado, sem que haja o compartilhamento de recursos. Sosinsky (2011, p. 48). Dentre os pontos positivos, está a garantia de segurança dos dados, e o desempenho que este modelo pode garantir. Os pontos negativos assinalam para o alto custo que um modelo como este pode representar, por necessitar de uma infraestrutura dedicada, em que não exista a concorrência por recursos computacionais. 36 2.1.5.3 Comunitário Também é possível trabalhar de forma mais segura do que o ambiente público, sem ter que realizar o investimento total de um modelo privado. Neste caso, há caracterizado o modelo chamado comunitário, em que duas ou mais organizações realizam investimentos em comum acordo, para viabilizar a utilização de um modelo privado, compartilhando os recursos entre ambas. Ainda se pode destacar neste modelo, os mesmos problemas com segurança e desempenho que existem no modelo público, mas minimizados com a redução do número de participantes de uma infraestrutura. Sosinsky (2011, p. 48). 2.1.5.4 Híbrido Quando existe a união de dois ou mais modelos destacados anteriormente, consideramos um modelo do tipo híbrido. Este é um dos modelos mais promissores da Cloud Computing, pelo fato de utilizar as vantagens dos demais modelos, e ser uma alternativa inicial para as corporações que desejam começar a utilizar serviços da nuvem. Por exemplo, um cliente que esteja preocupado com a segurança e disponibilidade de seus dados, poderia utilizar um modelo privado, mas quando utilizar a nuvem para alocação de dados não críticos, poderia utilizar o modelo público que lhe atenderia da mesma forma que o modelo privado, mas sem o seu alto custo. Sosinsky (2011, p. 48). 2.1.6 Tipos de Serviço Além dos modelos de arquitetura existentes da nuvem, ela também é classificada quanto ao tipo de serviço que é prestado com a nomenclatura “como um serviço”, ou na língua inglesa, “as a service”. Ofertar tudo como serviço faz parte da estratégia de ascender a computação nas nuvens ao modelo de utilidade. A lista de tipos de serviços oferecidos é extensa, mas serão citados aqui os principais tipos, conforme se observa a seguir. Velte Ant; Velte Tob et al., (2011, p. 11) IaaS (Infrastructure as a Service) PaaS (Platform as a Service) 37 SaaS (Software as a Service) Figura 4 - Limites entre IaaS, PaaS, SaaS Fonte: CSA (2011b). A figura anterior explana as delimitações entre IaaS, Paas e Saas. Com base nisso, se pode classificar o modelo IaaS como responsável por manter uma infraestrutura física; o modelo PaaS em entregar uma solução para o desenvolvimento e execução de aplicações; e o modelo SaaS por entregar uma aplicação final e pronta para uso. 38 Naturalmente, já existem outras definições para diferentes tipos de serviços, conforme ocorre o crescimento da evolução dos serviços na nuvem. Sosinsky (2011, p. 53, tradução nossa), reforça que: os três tipos de modelos de serviços em conjunto, têm vindo a ser conhecido como o modelo SPI (SaaS, PaaS, IaaS) da computação em nuvem. Muitos outros modelos de serviço também já foram mencionados: StaaS, armazenamento como um serviço; IdaaS, Identidade como um serviço; CmaaS, compliance como um serviço, e assim por diante. No entanto, os tipos de serviço SPI abrangem todas as outras possibilidades. 2.1.6.1 Infraestrutura como um Serviço Conforme ilustrado pela figura 5, o modelo IaaS é a base de apoio de todos os demais modelos. Nele são fornecidos serviços ligados ao hardware e equipamentos de infraestrutura. De acordo com Sosinsky (2011, p. 52), a grande vantagem deste tipo de utilidade é que um usuário não precisa se preocupar com quais equipamentos serão adquiridos para sua utilização, já que seu prestador de serviço irá garantir todos os recursos necessários. Sua preocupação é focada em dimensionar a quantidade de recursos tecnológicos que irá precisar para executar determinada tarefa, e seu custo ficará definido pela quantidade cumulativa dos recursos que utilizar. Um usuário, por exemplo, poderia adquirir os tipos de serviços IaaS conforme citados abaixo: ciclos de CPU; quantidade de memória; espaço de armazenamento; velocidade de link de dados; firewalls e roteadores. Para o prestador de serviços, a grande vantagem é que ele poderá compartilhar sua infraestrutura física, e comercializar os serviços para diversos locatários ao mesmo tempo. Outra característica do IaaS é que os recursos podem ser dinamicamente ajustados, conforme a demanda dos serviços. Um usuário, por exemplo, poderia utilizar X ciclos de CPU e memória em uma situação normal de 39 utilização de seus serviços e aumentaria dinamicamente para Y ciclos de CPU e memória em momentos de grande demanda por parte das atividades que executa, sem que precise, para isso, realizar mudanças físicas em seu ambiente. Velte Ant; Velte Tob et al.(2011, p. 15) 2.1.6.2 Plataforma como um Serviço O PaaS é um modelo executado acima do modelo IaaS (vide figura 5), e tem como objetivo fornecer um meio compartilhado para que se possa criar e executar aplicativos e serviços na nuvem. Velte Ant; Velte Tob et al., (2011, pag. 14) cita alguns exemplos de utilização do PaaS que incluem principalmente: ambientes de desenvolvimento com bancos de dados; desenvolvimento de sistemas; integração de serviços web; hospedagem de serviços; utilização de sistemas operacionais. O modelo PaaS, assim como os demais tipos de serviços, podem atribuir vantagens ao usuário final e ao fornecedor do tipo de serviço. Um usuário de um ambiente PaaS não tem controle sobre a infraestrutura, como CPU, quantidade de memória alocada e espaço de armazenamento, porém tem o controle sobre o ambiente operacional de determinada aplicação. Para o fornecedor, o modelo PaaS é muito interessante, já que pode atender a múltiplos usuários simultaneamente em uma mesma estrutura. Um dos pontos contrários aos PaaS é que a interoperabilidade e a portabilidade entre fornecedores é prejudicada pelo fato de utilizarem soluções de padrões diferentes e incompatíveis, dificultando a migração entre fornecedores. Velte Ant; Velte Tob et al., (2011, pag. 14) 2.1.6.3 Software como um Serviço Conforme ilustrado na figura 5, o SaaS está acima da camada do PaaS, referenciado como uma aplicação final. De acordo com Miller (2008, p. 40), o 40 modelo SaaS é, provavelmente, o mais conhecido e difundido da Computação nas Nuvens. Segundo Velte Ant; Velte Tob et al., (2011, pag. 12), este modelo proporciona aplicativos para serem utilizados por meio da Internet, sem que o cliente precise se preocupar com a infraestrutura necessária para utilizá-lo. O propósito central é que o usuário possa acessar aplicativos utilizando um navegador de páginas em qualquer lugar e a qualquer momento. Será de responsabilidade do provedor do serviço manter toda a infraestrutura necessária para que o software seja executado adequadamente. Miller (2008, p. 40, tradução nossa) também descreve que, cada organização servida pelo fornecedor é chamada de um inquilino, e esse tipo de arranjo é chamado de arquitetura multi-inquilino. Os servidores do fornecedor são virtualmente particionados para que cada organização trabalhe com uma instância de aplicativo virtual personalizado. Também é reforçado por Velte Ant; Velte Tob et al., (2011, pag. 14) que, o SaaS difere das antigas distribuições de soluções de computação, uma vez o SaaS foi desenvolvido especificamente para uso de ferramentas web, como o navegador. Isto torna-os web-nativos. Foi construído também com um múltiplo back-end, que permite a múltiplos clientes usarem o mesmo aplicativo. Como o ambiente é compartilhado entre diferentes usuários, o fornecedor que disponibiliza serviços de SaaS terá o seu trabalho reduzido para efetuar atualizações e manutenções, na medida em o fará em apenas poucos locais, diferentemente do modelo existente, onde cada usuário precisa executar sua própria atualização, ou mesmo manutenção. 2.2 A SEGURANÇA E OS LIMITES DA COMPUTAÇÃO NAS NUVENS Um dos grandes percalços na caminhada em direção à utilização da nuvem é a preocupação quanto à segurança da informação. Além disso, a nuvem também tem suas limitações e pode não se adequar a realidade de todos os ambientes. As corporações se preocupam muito quanto à confidencialidade, à disponibilidade e à integridade dos dados. Quando dados sensíveis são enviados para a nuvem, espera-se que eles sejam mantidos seguros, livres de acessos não autorizados e 41 que se mantenham íntegros. Também é indispensável que estes dados estejam sempre disponíveis, a qualquer hora e em qualquer lugar. 2.2.1 Principais Preocupações Uma pesquisa foi realizada pelo IDC e apresentada por Velte Ant; Velte Tob et al., (2011, pag. 35), conforme ilustrada na figura 6, esta investigação apresenta a opinião de 244 executivos de TI sobre a utilização de serviços na nuvem. Do total de entrevistados, um grupo de 74,5% mostrou preocupação com a segurança de suas informações. Outros dois grupos com 58%, mostraram preocupação com a disponibilidade das informações e com o desempenho de soluções migradas para a nuvem. Figura 5 - Pesquisa sobre Computação nas Nuvens Fonte: Velte Ant; Velte Tob et al., (2011, pag. 35) Assim como ocorrem nas estruturas locais de TI, também podem ocorrer na nuvem diversos tipos de ataques que buscam acessar informações privilegiadas, ou mesmo interromper serviços ativos. De acordo com Velte Ant; Velte Tob et al., (2011, pag. 31), de fato existem muitos riscos na utilização da nuvem, porém muitas empresas provedoras de serviço estão se esforçando ao máximo em manter todo o ambiente da cloud computing seguro. Muitas vezes o ambiente mantido na nuvem pelo provedor é inclusive mais seguro do que nas próprias corporações que utilizam o serviço. Os provedores de serviços utilizam normas e recomendações que visam a 42 garantir um melhor nível de serviço prestado. Sosinsky (2011, p. 426, tradução nossa) reforça que: A computação em nuvem tem muitas propriedades únicas que a tornam muito valiosa. Infelizmente, muitas dessas propriedades tornaram a segurança uma preocupação singular. Muitas das ferramentas e técnicas que poderiam ser utilizadas para proteger seus dados, cumprir com os regulamentos, e manter a integridade de seus sistemas são complicados pelo fato de que você compartilha seus sistemas com os outros e, muitas vezes, terceirizam suas operações. Prestadores de serviços de computação em nuvem estão bem cientes destas preocupações e estão desenvolvendo novas tecnologias para lidar com elas. Também é importante ressaltar que é possível ter diferentes níveis de segurança em diferentes tipos de modelos de utilização da nuvem. Por exemplo, seria possível a utilização de um serviço em IaaS com um nível mínimo de segurança, e um nível maior com a utilização de serviço do modelo SaaS. A utilização dos serviços na cloud necessitará que cada corporação elabore um mapeamento dos controles já existentes na sua infraestrutura local, que verifique quais os mecanismos de segurança necessários, e que estabeleça uma relação com os controles e mecanismos que os provedores de nuvem podem fornecer. Sosinsky (2011, p. 426) Com base nas pesquisas citadas, manter de forma segura as informações armazenadas, é o principal desafio que as organizações precisam se concentrar. Ainda de acordo com Sosinsky (2011, p. 437), mecanismos de controle de acesso podem ser utilizados para mitigar os riscos da nuvem, como a autenticação, garantindo as credenciais de determinado usuário; a autorização, atribuindo aos usuários direitos e permissões de acesso e a auditoria, buscando contabilizar e registrar as ações realizadas na nuvem. 2.2.2 Limites da nuvem Como qualquer outra tecnologia, a nuvem também possui suas deficiências e que precisam ser levadas em conta antes da tomada de qualquer decisão em utilizar serviços fora dos limites das corporações. 43 2.2.2.1 Confidencialidade das informações Segundo a norma NBR ISO/IEC 27001 (2006, pag. 2), a definição para confidencialidade é a “propriedade de que a informação não esteja disponível ou revelada a indivíduos, entidades ou processos não autorizados”. Quando os dados são enviados para um centro de dados terceirizado, esta propriedade pode ser quebrada, já que a garantia pela confidencialidade das informações passa a ser também de responsabilidade do fornecedor. As informações percorrem por diferentes tipos de sistemas, arquiteturas, redes de informações e estão sujeitas a serem abertas de forma silenciosa, sem que seus proprietários tenham conhecimento do vazamento de suas informações. Segundo Velte Ant; Velte Tob et al., (2011, pag. 31), quando os dados são enviadas para nuvem, perde-se uma camada de controle das informações que foram alocadas em um ambiente externo. Reese (2009, p. 100), destaca algumas situações em que a confidencialidade dos dados poderia estar comprometida; como a falência declarada de um fornecedor; um processo judicial que obrigaria o fornecedor a conceder acesso às informações; ou ainda uma falha eventual de algum processo que venha a comprometer as informações alocadas. Com base nestes relatos, percebe-se que a criptografia tem papel vital para mitigar incidentes quanto à confidencialidade dos dados. Antes das informações serem enviadas para ambientes na nuvem, os dados devem ser criptografados, garantindo consequentemente uma maior segurança. É importante ressaltar que, apesar dos benefícios resultantes da criptografia dos dados, perde-se também desempenho no acesso das informações, em razão dos cálculos matemáticos necessários para criptografar e descriptografar constantemente as informações. Além disso, mecanismos de criptografia podem não serem aplicáveis em todos os tipos de sistema, inviabilizando a utilização dos serviços na nuvem quando se é necessário o total controle das informações. 2.2.2.2 Disponibilidade de serviços A norma NBR ISO/IEC 27001 (2006, pag. 2), descreve disponibilidade como “propriedade de estar acessível e utilizável sob demanda por uma entidade autorizada”. É necessário que quando serviços são utilizados na nuvem, eles 44 estejam disponíveis a qualquer momento e que tenham desempenho suficiente para atender as demandas das aplicações. O fornecedor de serviços precisa garantir a disponibilidade das aplicações, como também é necessário que ele tenha uma grande capacidade de comunicação com a Internet, visando atender todos os seus clientes de forma satisfatória com os serviços que está prestando. Do lado do cliente, também é necessário que ele também mantenha uma infraestrutura de comunicação com a Internet adequada para os tipos de serviços que irá utilizar. Ainda assim, manter uma estrutura de backup local ou mesmo em outro fornecedor de nuvem, pode ser uma boa alternativa para garantir uma maior disponibilidade dos serviços. 2.2.2.3 Tipos de aplicações Há alguns tipos de aplicações que não justificam sua movimentação para uma plataforma na nuvem, em função de suas próprias características. Por exemplo, uma aplicação que demanda uma quantidade significativa de troca de tráfego, poderia ser inviabilizada em uma estrutura na nuvem pelo seu alto custo relacionado. Além disso, aplicações legadas que não tenham condições de serem migradas, podem não serem portadas para o ambiente externo por questões de compatibilidade. É necessário que entenda-se a necessidade do negócio e das aplicações, para que seja possível uma análise prévia dos tipos de aplicações e serviços que teriam vantagens se utilizados em ambientes da cloud. 2.2.2.4 Conformidade com a legislação vigente A conformidade com a legislação vigente é outro fator que precisa ser observado. Os países possuem legislações diferentes e que podem influenciar na segurança dos dados. Países como o EUA (Estados Unidos da América) permitem ao governo o acesso às informações armazenadas na nuvem em casos de necessidades de investigações Velte Ant; Velte Tob et al (2011,p.32). Uma citação do código de prática da NBR ISO/IEC 27005 (2005, pag. xi), descreve que, 45 uma outra fonte é a legislação vigente, os estatutos, a regulamentação e as cláusulas contratuais que a organização, seus parceiros comerciais, contratados, e provedores de serviço tem que atender, além do seu ambiente sociocultural. Conforme observou-se, esta definição que visa descrever as fontes para estabelecer os requisitos de segurança da informação, também trás a preocupação com a legislação vigente. Como as informações armazenadas podem estar alocadas em diversos países, é importante observar qual a legislação vigente nestes locais. Em eventuais intimações com o provedor do serviço na nuvem, os dados de todos os clientes lá alocados podem ser abertos durante uma investigação. 2.2.2.5 Multi-Inquilino De acordo com Reese (2009, p. 3), o conceito de multi-inquilino ou como definido na língua inglesa, multi-tenant é a capacidade de um sistema oferecer múltiplas instâncias de serviços compartilhando os mesmos recursos com vários usuários ao mesmo tempo. Este tipo de conceito permite que a infraestrutura seja compartilhada, reduzindo investimentos e o custo atribuído com desenvolvimento e suporte necessário para manter as aplicações. Conforme Sosinsky (2011, p. 202, tradução nossa), multi-locação também tende para a média da variabilidade intrínseca da procura individual, porque o "coeficiente de variáveis aleatórias" é sempre menor do que ou igual a qualquer uma das variáveis individuais. Com uma demanda mais previsível e menos variação, serviços na nuvem podem ser executados em maiores taxas de utilização do que os sistemas individuais. Isso permite que sistemas de nuvem operem com maior eficiência e menores custos. Entretanto, o conceito de multi-inquilino pode resultar em alguns problemas para usuários que utilizam serviços compartilhados. Quando um fornecedor determina a quantidade de recursos destinada para uma determinada infraestrutura, ele poderá realizar uma análise pela média de utilização estimada para um serviço que irá fornecer. Ocorre que se este nível médio de utilização exceder o nível previsto poderá resultar em impactos para seus clientes. Por exemplo, um determinado usuário que utiliza massivamente o acesso ao sistema de armazenamento, através de operações de leitura e gravação randômicas, afetaria provavelmente os demais usuários que estão utilizando o mesmo serviço. 46 2.2.2.6 Dependência do fornecedor Certas aplicações são desenvolvidas na nuvem atendendo os requisitos de determinado fornecedor. O problema é que o usuário pode ficar sem alternativas quando necessitar da portabilidade para sistemas de outros prestadores de serviços. Como a aplicação foi desenvolvida utilizando métodos disponibilizados pelo terceiro, ela pode ficar totalmente dependente do ambiente utilizado, causando o que é chamado de “vendor lock-in”. É indispensável que os fornecedores sejam analisados, buscando entender as padronizações utilizadas, e se elas poderão ser portadas para outros sistemas sem a necessidade de adaptações. 2.2.3 Cloud Security Alliance Os problemas relacionados com segurança na nuvem evidenciaram a necessidade de existir um estudo que apontasse os principais riscos da utilização de um ambiente em cloud e como estes riscos poderiam ser mitigados. Com base nesta necessidade, uma associação sem fins lucrativos chamada CSA (Cloud Security Alliance)14 foi criada, buscando a realização de pesquisas e a identificação dos principais problemas com segurança na nuvem, sugerindo as melhores práticas de segurança no contexto da computação nas nuvens. Este grupo de estudo é apoiado por profissionais da indústria, empresas, associações e demais partes interessadas. O documento divulgado como “CSA Guidance” fruto do estudo do grupo, está atualmente na versão 3.0, e traz as definições sobre cloud computing, métodos de governança e operação da nuvem. Ele está dividido em três grandes sessões: arquitetura da Nuvem; governança na Nuvem; operação na Nuvem. Além das sessões principais, o guia traz consigo quatorze domínios que tratam assuntos relacionados à segurança e arquitetura de rede da nuvem. O estudo sugere que as organizações adotem abordagens baseadas em riscos durante a 14 CSA – http://www.cloudsecurityalliance.org 47 migração dos serviços para a nuvem. De acordo com o guia, uma empresa que for realizar a migração de um ativo para a nuvem, deverá classificá-lo em dados ou aplicações. A partir desta classificação, deverá avaliar os potenciais riscos quando estiverem em um ambiente da nuvem e qual a importância deles para a corporação. Com a definição de risco do ativo definida, pode-se determinar qual tipo de arquitetura utilizar: CSA (2011a). público; privado – interno (dentro da corporação); privado – externo (provedor terceiro); comunitário; híbrido. Segundo o CSA (2011a) também é importante, nesta etapa, possuir um mapeamento de processos das aplicações e dados, buscando encontrar a arquitetura ideal e o tipo de serviço que será utilizado, seja IaaS, PaaS ou SaaS. No ambiente da nuvem, dependendo da arquitetura escolhida e do tipo de serviço para determinada aplicação, podem existir diferentes responsabilidades entre a organização que está utilizando a nuvem e o provedor do serviço. A ilustração a seguir apresenta as responsabilidades entre os tipos de modelos computacionais da nuvem, visando o entendimento das responsabilidades entre a organização e o provedor de serviço da nuvem. 48 Figura 6 - Responsabilidades entre modelos computacionais da nuvem Fonte: CSA GUIA PT-BR (2011b). 49 2.3 VIRTUALIZAÇÃO Apesar de não ser um requisito obrigatório, a virtualização é um dos motores que impulsionaram a computação nas nuvens. Esta tecnologia busca aproveitar melhor os recursos computacionais, evitando desperdícios e garantindo, principalmente, flexibilidade na criação e movimentação de máquinas virtuais. O conceito de virtualização iniciou a partir de ano de 1960, quando a IBM 15 utilizou seus grandes mainframes16 para dividi-los em diversas máquinas virtuais, buscando maximizar a eficiência da utilização dos grandes computadores. Dessa forma, era possível que diversas máquinas virtuais trabalhassem ao mesmo tempo, compartilhando recursos. Com o passar dos anos, por volta de 1980, o modelo cliente-servidor dos processadores x8617 acabou dominando o mercado da tecnologia de computadores, deixando a virtualização em desuso. A tecnologia x86 tinha um baixo custo e permitia um modelo de computação distribuído. Neste modelo era possível que servidores com processadores x86 de alto poder de processamento executassem aplicações para diversas máquinas clientes ao mesmo tempo. Blokdijk; Menken (2009, p. 11) Os processadores foram evoluindo ao longo dos anos, crescendo verticalmente em capacidade de processamento e horizontalmente em número de núcleos. Apesar da grande evolução dos processadores, eles não eram utilizados em sua totalidade, passando a ficar ociosos durante sua maior parte da carga de trabalho. Somado a isto, novas necessidades surgiam, buscando reduzir custos com TI, e aumentando a disponibilidade de sistemas computacionais. A solução para isso seria a volta da tecnologia de virtualização iniciada na década de 1960. A VMware 18 introduziu em 1999 a primeira solução para virtualização em processadores x86, resgatando a tecnologia que havia sido deixada para trás. Blokdijk; Menken (2009, p. 12) 15 IBM – International Business Machines – Empresa situada nos EUA, voltada para a área de informática. 16 Mainframe – Computador de grande porte, com alto poder de processamento. 17 Tipo de arquitetura de processadores 18 VMware – Empresa situada nos EUA, desenvolvedora de software para virtualização. 50 A tecnologia de virtualização evoluiu muito a partir do ano de 1999. Nos dias atuais é possível encontrar soluções de diferentes fabricantes que possuem soluções para virtualização, para diferentes plataformas e tipos de serviços. 2.3.1 Vantagens A virtualização oferece uma série de vantagens, buscando maximizar a utilização dos recursos de TI e reduzindo consequentemente seu custo. Dentre as vantagens, é possível citar: redução no custo de infraestrutura; aumento de disponibilidade de sistemas; melhor aproveitamento de recursos ociosos; maior taxa de consolidação; menor tempo para entrega de serviços computacionais; facilidades na recuperação de desastres; gerenciamento centralizado; economia de espaço físico. 2.3.2 Desvantagens A utilização da virtualização possui uma série de benefícios, entretanto também traz algumas desvantagens em sua adoção como: alto consumo de memória física, podendo ser um gargalo na infraestrutura física; concentrador de risco, quando há mais de uma máquina virtual em um mesmo hardware; perda de desempenho quando comparado ao hardware físico; segurança na camada de virtualização. 51 É evidente que as desvantagens citadas são pequenas, se comparadas com as vantagens da tecnologia. Estas desvantagens podem ser facilmente analisadas e mitigadas através de análises pontuais dos riscos. 2.3.3 Virtual Machine Monitor Segundo Sosinsky (2011, p. 202), uma VMM (Virtual Machine Monitor) ou hypervisor como também é referenciado, é um programa de baixo nível para fornecer ao sistema operacional acesso a recursos da máquina física. A virtualização pode ser classificada em dois tipos de arquitetura, o “tipo I” e o “tipo II”. O “tipo I” adiciona uma camada de virtualização entre o hardware e o sistema operacional convidado, garantindo um melhor desempenho, evitando a competição de processos entre o sistema operacional convidado e a camada de virtualização. Um hypervisor que executa um sistema operacional convidado no “tipo I” pode trabalhar como uma virtualização completa de processador (Full Virtualization) ou como uma para-virtualização (paravirtualization). Na virtualização completa, a máquina virtual tem acesso direto às instruções do processador, garantindo em algumas ocasiões um melhor desempenho. Na para-virtualização, é necessário uma interface entre o hypervisor e a máquina virtual que está sendo executada, geralmente modificando o sistema operacional convidado e garantindo, assim, um melhor desempenho. Sem a interface, ocorre uma emulação completa do hardware, reduzindo o desempenho da máquina virtual. Sosinsky (2011, p. 202) Já a virtualização de “tipo II”, tem instalada a camada de virtualização dentro de um sistema operacional hospedeiro subjacente. O grande problema do tipo II é que o sistema operacional hospedeiro irá concorrer na utilização de recursos com a camada de virtualização, afetando o desempenho dos sistemas operacionais convidados. Quando o “tipo II” executa uma máquina virtual, ela está virtualizada por meio da para-virtualização, da virtualização total, ou por meio de uma emulação completa de hardware. Sosinsky (2011, p. 203) É importante ressaltar que, para que a virtualização completa possa ter um desempenho maior que a para-virtualização, é necessário que o processador esteja preparado para entender as instruções corretas. Os processadores mais recentes da 52 Intel19 e AMD20 possuem suporte aos recursos VT-x e AMD-V respectivamente, que garantem a possibilidade de execução da virtualização completa com o maior desempenho possível. Este tipo de virtualização com suporte nos processadores, também é conhecido como a virtualização com hardware assistido. Quando o recurso de virtualização no processador é inexistente, os hypervisors paravirtualizados costumam ter um desempenho superior que a virtualização completa, pois conseguem analisar rapidamente as requisições das máquinas virtuais por meio da modificação existente no sistema operacional convidado. Mattos (2012) Em grande parte das instalações, o “tipo I“ é utilizado para provedores de serviço ou corporações com serviços locais de TI que buscam o melhor desempenho para as máquinas virtuais. Já o “tipo II”, é comumente utilizado para desenvolvimento e homologação de aplicações, ou mesmo para utilização doméstica. A figura 8 exemplifica a arquitetura de um ambiente virtual conhecido como virtualização de “tipo I” e o “tipo II”. O modelo “tipo I” é o mais utilizado para consolidar aplicações legadas da TI local de uma corporação. 19 20 INTEL - Empresa multinacional de tecnologia dos Estados Unidos da América. AMD - Advanced Micro Devices – Empresa multinacional dos Estados Unidos da América. 53 Figura 7 - Tipos de arquitetura de virtualização. Fonte: Elaborado pelo autor. 2.3.4 Soluções de Virtualização Existem, atualmente, inúmeras soluções com o propósito de realizar a virtualização de máquinas virtuais. Algumas soluções trabalham exclusivamente com o “tipo I“, e outras com o “tipo II”. Este trabalho irá apresentar brevemente as soluções Qemu, KVM, Xen, VirtualBox e o VMware ESX. Estes hypervisors citados estão entre os mais utilizados para ambientes de produção e também para ambientes de testes e homologação. 54 2.3.4.1 Kernel-based Virtual Machine O KVM (Kernel-based Virtual Machine), mantido pela RedHat21, é uma solução de código aberto para a infraestrutura de virtualização de máquinas virtuais e utilizado concomitantemente com o emulador e virtualizador Qemu. O KVM é instalado como um módulo do kernel do Linux e foi originalmente desenvolvido para arquitetura x86 e x86_64. Para utilizar o KVM é necessário que o processador do hardware hospedeiro contenha a extensão de virtualização disponível nos processadores AMD ou INTEL. O KVM executa em modo de virtualização completa de processador, embora utilize a para-virtualização para dispositivos de entrada/saída. Kvm (2011) 2.3.4.2 Qemu O Qemu é uma aplicação de código aberto que realiza a emulação e virtualização de máquinas virtuais. O Qemu pode trabalhar em modo usuário para emulação de sistemas operacionais e para diferentes plataformas de CPU ou no modo de virtualização completa, onde consegue virtualizar completamente a arquitetura de hardware para uma máquina virtual. É importante ressaltar que o Qemu é utilizado como complemento de virtualização para diversos hypervisors. Nestes casos, o Qemu é empregado para a para-virtualização de dispositivos de entrada/saída. É possível citar entre eles o KVM, Xen e Virtualbox. Qemu (2012a) 2.3.4.3 Xen O Xen é uma plataforma de código aberto para realizar a virtualização de máquinas virtuais de diversas arquiteturas como x86 e x86_64, além de outras. O Xen possui variações da sua plataforma, que trabalham como “tipo I“ ou “tipo II”, e também da forma para-virtualizada ou virtualização completa. Assim como o KVM, o Xen necessita que o processador do hardware hospedeiro contenha a extensão de virtualização disponível nos processadores AMD ou INTEL, para que possa realizar a virtualização completa. A plataforma Xen é uma das mais utilizadas atualmente e 21 RedHat – Empresa multinacional com base nos Estados Unidos da América que produz software baseado no sistema operacional Linux. 55 empregada, também, como base para soluções proprietárias de virtualização como o XenServer22 da Citrix Systems e como solução de virtualização da Oracle23, conhecida como Oracle VM24. Xen (2012) 2.3.4.4 Vmware ESX O VMware ESX é uma solução proprietária de virtualização pertencente a corporação VMware, Inc., subsidiária da EMC Corporation25. O hypervisor do VMware ESX trabalha no “tipo I” e permite a virtualização de diversos sistemas operacionais no modo para-virtualizado ou virtualização completa. Vmware (2012b) 2.3.4.5 Virtualbox O Virtualbox é uma solução de virtualização pertencente a Oracle e que utiliza como modelo de trabalho o “tipo II” de virtualização. O VirtualBox é instalado em um sistema operacional hospedeiro realizando a para-virtualização ou, ainda, a virtualização completa, quando o processador possuir suporte a extensão de virtualização ativa. Por trabalhar exclusivamente com o “tipo II”, o VirtualBox tem uma maior adoção em ambientes domésticos e de homologação. Virtualbox (2012) 2.4 O ARMAZENAMENTO DE DADOS Assim como a virtualização, as tecnologias de armazenamento de dados são de suma importância para o crescimento da computação nas nuvens. Muitas tecnologias foram desenvolvidas e aprimoradas para garantir o máximo de confiança quanto se fala de armazenamento de dados. Existem diversas alternativas de arquiteturas para armazenamento de informações, sejam elas de acesso local ou acesso compartilhado em redes de dados, das quais podemos citar os tipos de storage DAS (Direct Attached Storage), NAS (Network Attached Storage) e SAN (Storage Area Network). A palavra da língua inglesa “storage”, que na tradução do 22 XenServer – Solução proprietária de virtualização - www.xensource.com. Oracle – Empresa multinacional de tecnologia dos Estados Unidos da América. 24 Oracle VM - http://www.oracle.com/us/technologies/virtualization 25 EMC Corporation - Empresa multinacional fornecedora de sistemas para infraestrutura e situada nos Estados Unidos da América. 23 56 português brasileiro significa “armazenamento”, é um termo técnico utilizado e generalizado como um dispositivo centralizado para o armazenamento de dados. 2.4.1 Direct Attached Storage O storage do tipo DAS utiliza uma conexão direta entre o storage e o host cliente. Todas as requisições de acesso ao disco são feitas diretamente para o storage, que pode ser desde um simples disco conectado, até um equipamento storage dedicado em configuração raid 26 ativa, para o armazenamento de dados. Tecnologias como PATA (Parallel Technology Attachment), SCSI (Small Computer System Interface), SATA (Serial Advanced Technology Attachment), SAS (Serial Attached SCSI) e FC (Fibre Channel) são algumas tecnologias de conexões utilizadas em modelos do tipo DAS. Sacks (2001) 2.4.2 Network Attached Storage Um equipamento de storage do tipo NAS é aquele que fornece um meio de armazenamento de dados por meio de uma rede LAN (Local Area network), utilizada concomitantemente com a estrutura existente para a comunicação de serviços de rede baseados em TCP/IP. Normalmente estes tipos de dispositivos são servidores ou equipamentos dedicados com vários discos de armazenamento de dados. Estes discos, geralmente, participam de um grupo de raid, buscando um maior desempenho de I/O (Input/Output) de dados e redundância de discos. Para a comunicação do NAS com os clientes (hosts), normalmente utilizam-se protocolos como o CIFS (Common Internet File System) e o NFS (Network File System). Sacks (2001) 2.4.3 Storage Area Network Storage Area Network é a forma de armazenamento de dados utilizando uma rede de dados dedicada, exclusivamente, para o tráfego de informações. Este tipo de storage é indicado para aplicações que necessitam de um alto desempenho para 26 Raid – Tipo de tecnologia utilizada para criar uma redundância em um conjunto de discos independentes, além de oferecer mais desempenho para o acesso e gravação de dados. 57 o acesso aos dados, ao mesmo tempo em que necessitam da escalabilidade para o crescimento futuro. Em uma mesma rede SAN, podem estar disponíveis vários equipamentos de armazenamento de dados, os quais são acessados por diversos hosts simultaneamente. Usualmente, a comunicação dos dados em uma rede SAN pode ocorrer utilizando a tecnologia de transporte de dados FC, ou utilizando o protocolo de internet IP conhecido como iSCSI (Internet Small Computer System Interface), que utiliza como meio de transporte a rede do tipo ethernet. Assim como os equipamentos NAS, os discos de um equipamento do tipo SAN, geralmente participam de um grupo de raid buscando um maior desempenho de I/O (Input/Output) de dados e redundância de discos. Sacks (2001) Também é importante ressaltar, que em uma SAN os discos de armazenamento são apresentados aos seus clientes como uma LUN (Logical Unit Number). Uma LUN é uma referência utilizada para identificar uma unidade lógica em uma rede SAN. Por exemplo, um dispositivo SAN disponibiliza uma determinada LUN de nome lun0 com determinado volume e mapeia esta LUN para um host específico. Sacks (2001) 58 3 SOLUÇÃO PARA GERÊNCIA DA INFRAESTRUTURA DA NUVEM Neste capítulo, serão abordadas as diversas soluções para orquestrar um ambiente de infraestrutura da nuvem. A sessão 3.1 irá definir o conceito de orquestrar a nuvem, enquanto a sessão 3.2 irá apresentar as diversas soluções existentes, bem como uma análise parcial das soluções de IaaS existentes. As sessões 3.3 e 3.4 irão apresentar em maiores detalhes, as soluções Eucalyptus e Openstack respectivamente. Por fim, a sessão 3.5 irá apresentar um estudo comparativo entre OpenStack e Eucalyptus. 3.1 ORQUESTAR O AMBIENTE DA NUVEM Segundo o dicionário MICHAELLIS (2009), a palavra orquestrar significa “Compor as diferentes partes de uma peça musical para ser executada por orquestra” ou ainda “Orquestrar os componentes de uma equipe”. Em uma orquestra sinfônica, grupos orquestrais são regidos por um maestro que tem a responsabilidade de conduzir estes grupos a um objetivo final, a apresentação ao grande público. Fazendo uma analogia com a Computação nas Nuvens, o maestro, é a aplicação que controlará os diferentes tipos de sistemas de virtualização, as diferentes plataformas de armazenamento, as atribuições e os controles de acesso, delineando, por fim, a estrutura que será disponibilizada ao usuário. Os conceitos de virtualização e armazenamento centralizado são, atualmente, bem compreendidos e utilizados por grande parte das corporações, mas a grande oferta de soluções e padrões estabelecidos evidenciou o desafio existente em orquestrar esta variedade de soluções e garantir uma organização e simplificação do ambiente na nuvem. 3.2 SOLUÇÕES DE IAAS EXISTENTES Nesta sessão serão descritas soluções de IaaS utilizadas como referência para o desenvolvimento deste trabalho. Os principais serviços da Amazon serão descritos e, conforme citado anteriormente neste trabalho, também existem diversas soluções de código aberto que foram desenvolvidas e estão disponíveis para realizar 59 o gerenciamento de uma infraestrutura para a nuvem. O quadro abaixo apresenta seis principais soluções escolhidas. Quadro 2 - Soluções para gerenciamento de ambientes IaaS. Nome Tipo de Plataforma Versões código Arquitetura Amazon AWS IaaS Proprietário Público Eucalyptus IaaS Proprietário/Aberto Privado/Híbrido Nimbus IaaS Aberto Privado/Híbrido OpenNebula IaaS Aberto Privado/Híbrido Aberto Público/Híbrido/Privado OpenStack IaaS Fonte: Elaborado pelo autor. 3.2.1 Amazon Web Services A Amazon é uma grande empresa de comércio eletrônico dos EUA, que no ano de 2002 começou a oferecer serviços na internet conhecidos como AWS27 (Amazon Web Services). Estes serviços evoluíram ao longo dos anos e, de forma pioneira, a Amazon aprimorou sua estrutura de modo a oferecer serviços sob demanda. Atualmente, os serviços da AWS formam um conjunto de soluções para oferecer IaaS para empresas e usuários domésticos. A Amazon possui zonas de sua infraestrutura espalhadas em algumas localidades do mundo, incluindo o Brasil, onde está instalada na cidade de São Paulo. Amazon (2012c) Dentre os diversos serviços oferecidos, este trabalho irá destacar três principais: EC2 (Elastic Compute Cloud): Serviço que oferece capacidade de computação redimensionável na nuvem. Com o EC2 é possível gerenciar instâncias de máquinas virtuais em poucos minutos, escalonando para mais ou para menos a quantidade de recursos necessários. Além das diversas características, o EC2 fornece um conjunto de funções que podem ser executadas via API. Estas funções permitem que sistemas de gerenciamento de terceiros sejam integrados com a 27 AWS – http://aws.amazon.com 60 estrutura EC2 da Amazon, possibilitando a criação de instâncias, grupos de segurança, controles de acesso, entre outros. Amazon (2012a) EBS (Elastic Block Store): O serviço EBS fornece volumes de armazenamento em bloco para a utilização com instâncias EC2. Os volumes EBS são armazenados fora da instância e garantem uma vida independente da instância. Os volumes EBS podem ser utilizados para banco de dados, sistema de arquivos ou acesso a um armazenamento bruto do bloco. Amazon (2012e) S3 (Simple Storage Service): Assim como o EBS, o S3 fornece um serviço de armazenamento de dados, porém com utilização projetada para utilização na internet via protocolo HTTP28 ou BitTorrent29. Outra grande diferença do S3 para o EBS é que o EBS mantém os dados apenas em uma zona da Amazon, enquanto o S3 pode replicar os dados do volume ao longo das demais zonas, garantindo réplicas dos dados alocados. Em contrapartida, a velocidade de leitura e gravação de dados ao S3 pode ser menor se comparada com o EBS. Além disso, o S3 permite manter imagens de estado (snapshots) do serviço EBS, garantindo, assim, backups dos volumes EBS. Também é fornecido pelo S3 interfaces de integração (API) SOAP e REST para o gerenciamento de arquivos. Amazon (2012b) 3.2.2 Nimbus O Nimbus é uma plataforma focada na infraestrutura da computação nas nuvens. Possui integração com Xen e KVM, e é compatível como o padrão de API EC2 e S3 da Amazon. Apesar de ele poder ser utilizado tanto para provedores que desejam oferecer serviços em nuvem como para usuários finais ou desenvolvedores que precisam testar aplicações, ele tem um forte apelo acadêmico, o qual é utilizado para gerenciar alguns tipos de aplicações legadas. Nimbus (2012a) 3.2.3 OpenNebula O OpenNebula, é um projeto de código aberto que busca desenvolver uma padronização para a indústria, com o objetivo de gerenciar ambientes virtualizados e 28 29 HTTP - Hypertext Transfer Protocol – Protocolo utilizado para comunicação de sites web. BitTorrent – Protoloco de transferências de arquivos em topologia peer-to-peer. 61 infraestrutura de uma nuvem híbrida e privada, apesar de também ser suportado para o gerenciamento de uma nuvem pública. O projeto OpenNebula foi iniciado como uma pesquisa no ano de 2005, e teve sua primeira versão disponibilizada em 2008. O OpenNebula pode gerenciar os hypervisors Xen, KVM, e VMware além de suportar integração com o modelo de API EC2 da Amazon. Opennenula (2012a) 3.2.4 Eucalyptus O Eucalyptus é uma aplicação madura, open-source, que trabalha com alguns tipos de hypervisors como o Xen e KVM, e realiza a integração com o padrão de API EC2 e S3 da Amazon. Iniciado a partir de um projeto de pesquisa da Universidade da Califórnia, Santa Barbara em 2007, ele foi desenvolvido com base na infraestrutura do fornecedor de IaaS Amazon, buscando adicionar suas principais características e funcionalidades. O Eucalyptus possui duas divisões internas, uma divisão open-source baseada na licença GPL v3, e outra proprietária. A licença proprietária disponibiliza outras funcionalidades, como integração com hypervisor VMware ESX e suporte técnico, que não estão inclusas na versão open-source. Eucalyptus (2012b) 3.2.5 OpenStack O Openstack é uma solução de gerência de uma nuvem IaaS, seu código é totalmente livre e surgiu em 2010, fruto de um de projeto de pesquisa e desenvolvimento a partir da união da NASA (National Aeronautics and Space Administration) dos Estados Unidos e da empresa privada de infraestrutura, Rackpace. O conceito principal do Openstack, que está baseada na licença Apache 2.0, é fornecer uma plataforma de gerenciamento de infraestrutura neutra e compatível com o maior número possível de desenvolvedores de aplicações e infraestrutura. O OpenStack pode controlar os hypervisors Xen/XenServer, KVM, VMware/ESX, LXC (Linux Containers) UML (User Mode Linux), Hyper-V, Qemu e também realiza a integração com o padrão de API EC2 e S3 da Amazon. OpenStack (2012b) 62 3.2.6 Análise Parcial das Soluções As soluções apresentadas neste trabalho têm como foco principal a implantação de um modelo de IaaS, oferecendo infraestrutura como um serviço para seus usuários. Cada solução tem suas peculiaridades e pode ser utilizada em diferentes ambientes. Os serviços AWS30 (Amazon Web Services) da Amazon, conforme citado anteriormente neste trabalho, formam um conjunto de soluções para oferecer infraestrutura como um serviço. Pelo grande sucesso obtido por meio dos serviços AWS, acabou sendo referência para outras soluções. Todas as soluções que foram citadas neste trabalho possuem suporte para a integração de API com os serviços S3 e EC2 da Amazon. De acordo com a análise realizada por Sempolinski; Thain (2010), o Nimbus é um projeto com um longo tempo de vida, integrado com o projeto de computação em grid, o Globus Project31, e tem um foco maior voltado para pesquisas científicas. O OpenNebula pode ser considerada uma solução mais interessante, devido ao fato de integra-se com grande parte dos hypervisors existentes, e oferecer escalabilidade para crescimento futuro. O trabalho de Sempolinski; Thain (2010), também realizou a análise do OpenNebula, considerando uma solução robusta e voltada para aplicação de nuvens híbridas e privadas. De acordo com Schubert (2012) um estudo realizado pela Comissão Européia, apontou o OpenNebula como uma solução promissora e com foco para o gerenciamento de nuvens híbridas e privadas. O projeto Eucalyptus é uma solução muita madura, com um grande número de participantes e segue o padrão EC2 e S3 da Amazon. O projeto é apoiado por diversas empresas e utilizado como solução para prover principalmente nuvens híbridas e privadas, ainda que possa também ser utilizada para o perfil de clientes de nuvem pública. O fato do possuir uma divisão open-source e uma proprietária com mais recursos, pode-se considerar que o Eucalyptus não é uma solução totalmente livre. O OpenStack é uma plataforma muito nova, mas atraiu a atenção de grandes empresas mundiais pelo seu potencial futuro. A solução agrupa as melhores ideias dos demais projetos de computação nas nuvens, buscando entregar uma solução 30 AWS – http://aws.amazon.com 63 totalmente livre, que possa ser utilizada por grandes fabricantes e provedores de serviço de nuvem pública. Tem a participação de grandes empresas públicas e privadas, das quais se pode citar a Dell, RedHat, Microsoft, Citrix, Intel, Canonical, Cisco, HP, F5, Nasa, Rackspace, entre outras. Assim como o Eucalyptus, também é totalmente compatível com as interfaces de integração EC2 e S3. A escolha deste trabalho em utilizar o OpenStack como solução para implantação de um ambiente de gerência na nuvem, dá-se pelo fato de ser uma aplicação promissora e robusta para empresas públicas e privadas que desejam oferecer infraestrutura como serviço. Também é importante ressaltar que o Eucalyptus será utilizado como base comparativa, buscando apontar as principais diferenças entre as duas soluções. Ele foi escolhido como base comparativa, por ser a plataforma que mais se assemelha com o modelo proposto do OpenStack. 3.3 EUCALYPTUS O Eucalyptus é uma solução que gerencia um conjunto de equipamentos e sistemas, possibilitando a entrega de serviços de IaaS na nuvem. Ele permite que sejam utilizados equipamentos legados como servidores, switchs e storages, para a criação de uma nuvem privada para corporações e, híbrida, através da integração com os padrões da Amazon EC2, S3. Ele foi desenhado para ser uma aplicação modular e de fácil instalação, com suporte a recursos de alta disponibilidade. Eucalyptus Systems (2012b). 3.3.1 Principais Componentes Eucalyptus é formado por seis componentes principais, o Cloud Controller (CLC), o Walrus, o Cluster Controller (CC), o Storage Controller (SC), o Node Controller (NC) e um opcional componente para integração com o VMWare, o VMware Broker. Ele também desenvolveu um pacote de comandos para a administração do ambiente Eucalyptus, baseado e compatível com o Amazon AWS chamado euca2ools. A imagem a seguir, demonstra a arquitetura principal do Eucalyptus. Eucalyptus Systems (2012c). 31 http://www.globus.org/toolkit/ 64 Figura 8 - Arquitetura principal do Eucalyptus. Fonte: Eucalyptus Systems (2012c). 3.3.1.1 Cloud Controller (CLC) Utilizado por administradores, desenvolvedores, gerentes de projetos e usuários finais que buscam executar ações na nuvem, o CLC (Cloud Controller) é a porta de entrada para efetuar o gerenciamento do Eucalyptus. Ele também interage diretamente com os CCs (Cluster Controllers), gerenciando recursos como servidores, redes e armazenamento. O acesso a ele é realizado através de uma interface web administrativa, ou através de ferramentas de linha de comandos com o euca2ools. Eucalyptus Systems (2012c). 3.3.1.2 Walrus O Walrus permite aos usuários armazenar dados persistentes, organizados em containers e objetos. Ele é análogo ao serviço S3 da Amazon, e provê operações para criar, apagar, listar containers, ou enviar, obter e apagar objetos. Também é possível utilizar o Walrus para armazenar e acessar imagens de máquinas virtuais. Eucalyptus Systems (2012c). 3.3.1.3 Cluster Controller (CC) O CC (Cluster Controller) efetua o gerenciamento da localização de máquinas virtuais e também realiza o agendamento para a execução de instâncias. Através de solicitações recebidas do controlador da nuvem (CLC), o CC agenda a execução de instâncias nos controladores de nós (NCs). O CC também pode atuar como um 65 roteador das máquinas virtuais, roteando entre a rede pública e a rede privada das instâncias. Eucalyptus Systems (2012c). 3.3.1.4 Storage Controller (SC) O SC (Storage Controller) provê serviços similares ao EBS da Amazon, possibilitando anexar volumes a instâncias de máquinas virtuais. Ele permite realizar a interface entre diferentes tipos de sistemas de storage (NFS, iSCSI, SAN, discos locais, entre outros). Os volumes de dados do SC são persistentes, e também é possível realizar fotos de estado (snapshots) destes volumes para serem armazenados no sistema de armazenamento de objetos Warus. Eucalyptus Systems (2012c). 3.3.1.5 Node Controller (NC) O NC (Node Controller) está localizado em máquinas físicas que executam instâncias de máquinas virtuais e é responsável por iniciar, terminar e inspecionar as máquinas virtuais. Atualmente, ele suporta os hypervisors Xen, KVM e VMWare (através do VMware Broker). Eucalyptus Systems (2012c). 3.3.1.6 VMware Broker VMware Broker é componente opcional do Eucalyptus que possibilita a integração com a plataforma VMware ESX/ESXi. Ele está disponível apenas na verão enterprise do Eucalyptus. Eucalyptus Systems (2012c). 3.3.1.7 Euca2ools O Eucalyptus também foi pioneiro e iniciou um projeto de código aberto, chamado euca2ools. Por meio de uma engenharia reversa, analisou os métodos da API dos serviços AWS da Amazon, e criou métodos semelhantes para gerenciar o ambiente IaaS do Eucalyptus e da própria Amazon. Eucalyptus Systems (2012g). 66 3.4 OPENSTACK Esta sessão irá apresentar os componentes que formam o projeto Openstack, buscando descrever seus componentes, os principais conceitos e a sua arquitetura. Conforme mencionado no item 3.2.5, a concepção principal do Openstack é fornecer um software de código aberto projetado para provisionar grandes redes de máquinas virtuais criando uma estrutura redundante e escalável. Atualmente, na versão “ESSEX”, a solução é dividida em cinco principais componentes, o Openstack Compute (codinome Nova), Openstack Object Store (codinome Swift) e Openstack Image Service (codinome Glance), o Openstack Dashboard (codinome Horizon) e o Openstack identity (codinome Keystone). É importante ressaltar que, originalmente, o Openstack foi desenvolvido com três componentes principais, o Swift, Glance e o Nova. No seu último lançamento, na versão “ESSEX”, foram incorporados os componentes Horizon e Keystone. Openstack, (2012c) Escrito basicamente na linguagem Python32, cinco versões do Openstack foram liberadas e apesar de recentes, podem ser utilizadas para ambientes de produção. Alguns exemplos são as soluções comerciais oferecidas pela Rackspace33 e a HP34. As versões do Openstack são liberadas a cada seis meses, conforme é possível observar na tabela a seguir: Tabela 1 - Versões de lançamento do Openstack Nome Data OpenStack Compute OpenStack Object Storage Lançamento Lançamento versão versão Essex April 2012 2012.1 1.4.8 Diablo October 2011 2011.3 1.4.3 Cactus April 2011 2011.2 1.3.0 Bexar March 2011 2011.1 1.2.0 Austin October 2010 0.9.0 1.0.0 Fonte: Editado pelo autor com base em Openstack (2012f). 32 Linguagem de programação de alto nível. http://www.python.org/ 33 http://www.rackspace.com/cloud/nextgen/details/ 34 http://www.hpcloud.com 67 3.4.1 Visão Global O Openstack foi projetado para entregar um sistema operacional totalmente escalável na nuvem. Desta forma, todos os serviços realizam a integração por meio de APIs, entregando serviços de infraestrutura para usuários finais, possibilitando, desta maneira, um crescimento horizontal da infraestrutura da nuvem. É possível observar, na figura a seguir, a integração entre os cinco componentes do projeto. Figura 9 - Arquitetura conceitual do Openstack. Fonte: Editado pelo autor com base em Openstack, (2012c). A seguir é descrita uma visão geral sobre cada subprojeto da família do Openstack, e também são descritos alguns outros componentes e terminologias necessários para a boa percepção do projeto OpenStack. Compute (Nova): O Nova tem a responsabilidade de prover servidores virtuais sob demanda. Ele também fornece volumes de dados para serem alocados para máquinas virtuais. O serviços providos pelo Nova são análogos ao EC2 e EBS da Amazon. Openstack, (2012c) 68 Image Store (Glance): O Glance fornece um repositório e catálogo de imagens de discos virtuais. Seu uso é opcional, embora ele seja extremamente importante para o gerenciamento de imagens de grandes instalações. Openstack, (2012c) Object Store (Swift): O componente Swift fornece o armazenamento de objetos, permitindo o armazenamento e a recuperação de objetos que podem ser, por exemplo, imagens e arquivos de mídia. O Object Store do Openstack é análogo ao S3 da Amazon. Openstack, (2012c) Identity (Keystone): O Keystone é um componente para prover as funções de autenticação e autorização para todos os serviços da família do OpenStack, Openstack, (2012c) Dashboard (Horizon): O Horizon prove uma interface web modular para todos os serviços disponibilizados pelo OpenStack. Openstack, (2012c) Banco de Dados: A utilização de um banco de dados é imprescindível para a comunicação entre todos os sujeitos do projeto OpenStack. No banco de dados são armazenadas e relacionadas todas as informações do projeto de nuvem estabelecido. Evidentemente, o OpenStack não fornece um sistema de banco de dados próprio, mas possui suporte nativo para alguns tipos de bancos de dados existentes. O Keysotne, Glance e o Nova possuem conectividade com o MySQL35, PostgreSQL36 ou SQLite37, enquanto que o Swift, pela sua arquitetura distribuída, utiliza apenas o SQLite. Openstack, (2012c) 3.4.2 Openstack Compute (Nova) O Nova é o controlador de nuvem do OpenStack. É ele que realiza todas as ações para gerenciar o ciclo de vida das imagens (instâncias), atribuindo recursos, acesso às redes de comunicação, realizando autorizações e gerenciando toda a 35 Banco de dados de plataforma aberta. http://www.mysql.com Banco de dados de plataforma aberta. http://www.postgresql.org 37 Tipo de sistema de banco de dados local - http://www.sqlite.org 36 69 escalabilidade necessária para a nuvem do Openstack. A integração com os hypervisors pode ser realizada utilizando a libvirt API38, ou utilizando a integração nativa do hypervisor, executada pelo próprio Nova. As atribuições a seguir, são de responsabilidade do OpenStack Nova: Openstack, (2012c) gerenciamento do ciclo de vida de instâncias; gerenciamento dos recursos computacionais; rede e autorização; API REST (Integração administrativa e pública); comunicação assíncrona; integração com hypervisors (Xen/XenServer, KVM, VMware/ESX, LXC (Linux Containers) UML (User Mode Linux), Hyper-V, Qemu). Conforme pode ser observado na figura a seguir, a comunicação entre os principais componentes do Nova, o nova-compute, o nova-volume, o nova-network, o nova-api, o nova-scheduler e o nova-objectstore é realizada por meio de uma fila de mensagens assíncrona, gerenciada pelo serviço RabbitMQ Server39, que utiliza o protocolo aberto AMQP (Advanced Message Queuing Protocol). Como o Nova realiza as chamadas assíncronas para o servidor de mensagens, evita a ocorrência de bloqueios dos componentes, enquanto aguarda pela resposta de um dos outros componentes. As operações como uploads de imagens ou execução de instâncias tendem a levar algum tempo para ter o processo concluído, explicando o porquê da necessidade da troca de mensagens serem de forma assíncrona. Além disso, a comunicação entre os componentes do Nova pode ser realizada localmente ou remotamente, permitindo que eles sejam instalados em um mesmo nó ou para ambientes maiores, em diferentes nós. Por exemplo, em um ambiente com vários nós podem existir um nó com o nova-compute, um nó com o nova-network e um último nó com o nova-objecstore. Openstack (2012e). Figura 10- Arquitetura de serviços do Openstack Compute (Nova) 38 Libvirt API – http://libvirt.org - Solução de código aberto que realiza a integração com diferentes tipos de hypervisors. 70 Fonte: Elaborado pelo autor com base em Openstack (2012e). 3.4.2.1 API Server (nova-api) O Nova-api é o serviço que realiza a interação com os usuários externos da nuvem. Utilizando o modelo de API EC2, ele recebe instruções externas baseado nos formatos JSON (JavaScript Object Notation) ou XML (Extensible Markup Language) e as repassa para o servidor de mensagens para efetuar a comunicação com os demais componentes. O Openstack também possui um alternativa de API, chamada de “OpenStack API”. Openstack, (2012c). 39 http://www.rabbitmq.com/ 71 3.4.2.2 Message Queue (Rabbit MQ Server) Conforme descrito anteriormente, o Message Queue é o servidor de mensagens que interage com os principais componentes do OpenStack, através da troca de mensagens assíncronas. O processo inicia quando um usuário envia uma solicitação via uma requisição HTTP. Antes de enviar a requisição, este usuário precisa autenticar-se e estar autorizado a enviar a requisição desejada. O serviço de mensagens verifica a disponibilidade de atender a requisição e, após a verificação de disponibilidade, coloca a requisição em uma fila para que seja atendido por um dos componentes do OpenStack. Após a conclusão da tarefa realizada pelo componente apropriado, uma resposta é enviada para a fila e remetida, finalmente, para o usuário final. Openstack (2012e). 3.4.2.3 Compute Worker (nova-compute) O nova-compute é o componente que efetua o gerenciamento do ciclo de vida de instâncias de máquinas virtuais. Ele recebe suas tarefas através de mensagens do “Message Queue” e dispara todas as solicitações necessárias (via Message Queue) para os demais componentes do Openstack, de forma que possa iniciar ou terminar o ciclo de vida de uma instância. Além do gerenciamento dos recursos como ips, espaço alocado, quota, entre outros, são responsabilidades primárias do nova-compute: Openstack (2012e). executar instâncias (via hypervisor); terminar instâncias (via hypervisor); reiniciar instâncias (via hypervisor); anexar volumes; retirar volumes; obter saído do console. 3.4.2.4 Network Controller (nova-network) O nova-network gerencia os recursos de rede para o ambiente das instâncias de máquinas virtuais. Ele é responsável por alocar endereços ip, configurar VLANs 72 (Virtual LAN)40 para os projetos, implementar grupos de segurança e configurar as redes para nós do Openstack. O nova-network pode entregar para as instâncias dois tipos de ips, um ip privado (fixo) ou um ip público (flutuante). A configuração com o ip privado é normalmente utilizada para a comunicação interna, entre instâncias, enquanto a configuração com o ip público é utilizada para comunicação com a Internet ou como uma rede privada (não necessariamente um ip roteado para a internet). Quando uma instância é iniciada, ela recebe um ip fixo privado e permanece com a instância até ela ser encerrada. Do contrário, um ip flutuante pode ser associado e dissociado à uma instância a qualquer momento. Também é possível que endereços ips flutuantes sejam reservados por usuários para determinado projeto. Openstack (2012e). É possível configurar projetos do nova-network em três modos diferentes: Flat Network Manager; Flat DHCP Network Manager; VLAN Network Manager. Para ambientes de produção, a recomendação do OpenStack é a utilização da configuração em modo “Rede VLAN”, o modo mais rico em recursos, enquanto que os outros dois modos podem ser utilizados para uma melhor familiarização do OpenStack. Openstack (2012e). No modo “Flat Network Manager”, uma configuração de sub-rede é estabelecida, e cada instância recebe um ip da sub-rede. Quando a instância é iniciada, ela obtém um ip do pool através de uma configuração baseada em um arquivo de configuração. No modo “Flat DHCP Network Manager”, um serviço de DHCP é iniciado para servir a distribuição de endereços ips. Em ambos os modos “Flat”, o nova-network será o gateway das instâncias do projeto. A figura a seguir demonstra como o nova-network realiza a tarefa de ser um gateway default das instâncias de máquinas virtuais. Openstack (2012e). 40 Isolamento virtual de redes de computadores. 73 Figura 11 - Arquitetura de rede do nova-network. Fonte: Editado pelo autor com base em Openstack (2012e). Por fim, no modo “Vlan Network Manager”, uma rede virtual entre o novacompute, o nova-network e no host onde a instância estiver sendo executada é estabelecida, de modo que seja possível realizar o isolamento lógico entre diferentes projetos do ambiente do OpenStack. Neste modo, para que seja possível a conexão externa de usuários com uma instância, é necessário que ele estabeleça uma conexão VPN (Virtual Private Network) com um endereço ip do nova-network atribuído para o projeto do usuário. 3.4.2.5 Volume Workers (nova-volume) Volume Workers são responsáveis por gerenciar volumes de dados baseados em LVM (Logical Volume Manager)41. O armazenamento em volumes de dados é uma maneira de realizar o armazenamento persistente para instâncias, já que a partição raiz de uma instância não é persistente, levando os dados a serem perdidos quando uma instância é terminada. O nova-volume tem a responsabilidade de criar, apagar, anexar e desanexar um volume para uma instância. Como o volume de dados é persistente, é possível que este volume seja anexado para outras instâncias, mantendo a integridade dos dados. Conforme pode ser observado na imagem a seguir, o nova-volume pode conectar-se a um dispositivo de armazenamento DAS, NAS ou SAN e disponibiliza o acesso para as instâncias através do protocolo ISCSI. Para fornecer o acesso ao protoloco iscsi, ele utiliza o 41 LVM - http://tldp.org/HOWTO/LVM-HOWTO/ 74 serviço iscsitarget42, que provê a capacidade de gerenciar requisições no protocolo iscsi. O nova-volume é análogo ao serviço EBS oferecido pela Amazon. Openstack (2012e). Figura 12 - Arquitetura do nova-volume.. Fonte: Elaborado pelo autor com base nas informações do Openstack (2012e). 3.4.2.6 Nova Objectstore (nova-objectstore) O nova-objectstore fornece uma interface de integração com o Swift ou com o serviço S3 da Amazon, utilizando o pacote de comandos euca2ools. 3.4.2.7 Scheduler (nova-scheduler) O nova-scheduler tem a incumbência de mapear as chamadas do nova-api, distribuindo para os componentes nova-compute e nova-volume apropriados do OpenStack. Ele tem um papel vital para o OpenStack, já que é um componente de inteligência responsável por balancear a carga de tráfego entre toda a nuvem de hosts. Por meio da utilização de um de algoritmo de escalonamento, ele utiliza um host para iniciar uma instância de um pool disponível, baseado em decisões como o fator de carga de um processador, a utilização de memória, a distância física de uma zona disponível, a arquitetura de CPU, entre outros. Os seguintes algoritmos estão disponíveis no nova-scheduler: Openstack (2012e). Chance: neste método, um host é escolhido aleatoriamente através das zonas disponíveis. Este é o algoritmo padrão para a escolha do nova-volume. Openstack (2012e). 42 http://iscsitarget.sourceforge.net/ 75 Multi Scheduler: o “Multi Scheduler” mantém sub-schedulers, utilizados para diferenciar o algoritmo do nova-compute do algoritmo do nova-volume. Este é o algoritmo padrão utilizado no nova-scheduler. Openstack (2012e). Simple: no “Simple”, os hosts que possuem a menor carga de trabalho são escolhidos. O “Simple” pode ser utilizado tanto para o nova-volume quanto para o nova-compute. Openstack (2012e). Filter Scheduler: este algoritmo suporta filtragem e verificação de pesos para efetuar a tomada de decisão de onde uma nova instância será criada. Ele é o algoritmo padrão utilizado para o nova-compute, quando definido o “Multi Scheduler”. Este algoritmo é válido, apenas, para o nova-compute, não podendo ser utilizado para o nova-volume. Openstack (2012e). Na definição do algoritmo “Multi Scheduler”, o nova-scheduler utiliza filtros, através do algoritmo “Filter Scheduler”. Isto possibilita que um administrador determine algumas regras que serão utilizadas para determinar os hosts que receberão a execução de uma instância. O quadro abaixo apresenta os filtros disponíveis para o algoritmo “Filter Scheduler”: Openstack (2012e). Quadro 3 - Filtros para utilização no nova-scheduler. Filtro AllHostsFilter AvailabilityZoneFilter ComputeFilter CoreFilter DifferentHostFilter IsolatedHostsFilter RamFilter Descrição Este filtro utiliza todos os hosts disponíveis do nova-compute (host). Filtra uma zona disponível. Verifica se um host tem capacidade suficiente para executar uma instância. Verifica se há núcleos suficientes no host para executar a instância. Realiza uma verificação para executar uma instância apenas em um host diferente de determinadas instâncias já iniciadas. Permite chavear algumas imagens para que sejam iniciadas apenas em determinados hosts e vice-versa. Permite definir uma quantidade máxima de RAM (em percentual) que uma instância pode exceder de um host. 76 Ao contrário do "DifferentHostFilter", verifica SameHostFilter quais hosts executam determinadas instâncias, para executar a próxima no mesmo host. Efetua uma verificação do agendamento SimpleCIDRAffinityFilter baseado no endereço de subnet do IP do host. Não é um filtro, mas uma função para adicionar um peso na filtragem dos itens acima. Quanto nova.scheduler.least_cost.com menor o peso final dos hosts, maior a pute_fill_first_cost_fn probabilidade de ser utilizado para iniciar uma instância. nova.scheduler.least_cost.noo Função para igualar o peso de todos os hosts, p_cost_fn não utilizado na prática. Fonte: Elaborado pelo autor com base nas informações do Openstack (2012e). Depois de efetuado o filtro dos hosts selecionáveis, um algoritmo de custo é aplicado, baseado em configurações pré-definidas, aumentando ou diminuindo a probabilidade de escolha de um host em um conjunto de hosts. A imagem a seguir apresenta o fluxo para a tomada de decisão do nova-scheduler. Openstack (2012e). Figura 13 - Fluxograma do processo de decisão do nova-scheduler. Fonte: Editado pelo autor com base em Openstack (2012e). 3.4.2.8 Tipos de Instâncias (Flavors) Tipos de instâncias ou flavors são perfis de máquinas virtuais pré-definidas em termos processamento, memória e capacidade de armazenamento. O padrão 77 EC2 API define nomes dos tipos de instâncias como “m1.large” ou “m1.tiny” enquanto o Nova utiliza nomes como “512 MB Server”. A tabela a seguir, lista os principais tipos de instâncias pré-definidas pelo EC2 API e que também são utilizados pelo Nova. Tabela 2 - Tipos de instâncias pré-definidas pelo EC2. Tipo Memória VCPU Storage m1.tiny 512MB 1 0GB m1.small 2048MB 1 20GB m1.medium 4096MB 2 40GB m1.large 8192MB 4 80GB m1.xlarge 16384MB 8 160GB Fonte: Criado pelo autor com base em Openstack (2012e). 3.4.3 Openstack Storage Infrastructure (Swift) O Swift é um sistema distribuído, redundante e com alta disponibilidade para o armazenamento de objetos (eventualmente consistente). Formado pelos componentes “Proxy Server”, “Account Servers”, “Container Servers” e “Object servers”, ele é capaz de armazenar bilhões de objetos distribuídos entre os nós, provendo um meio de armazenamento global e redundante. É importante ressaltar que o Swift não disponibiliza um volume para ser montado como um sistema de arquivos, mas, sim, um sistema de armazenamento de longo prazo para tipos de dados permanentes. Semelhante ao serviço S3 da Amazon, o Swift pode ser utilizado para o armazenamento de imagens de máquinas virtuais, o armazenamento de fotos, emails, backups, entre outros. Ele também permite um crescimento horizontal, formando um cluster (através de servidores legados, ou utilizando simples servidores com discos rígidos de diferentes tamanhos) para um sistema de armazenamento com capacidade virtualmente ilimitada. A imagem abaixo demonstra uma arquitetura simples do OpenStack Swift. 78 Figura 14 - Exemplo de arquitetura do OpenStack Swift. Fonte: Elaborado pelo autor com base em Openstack (2012d). 3.4.3.1 Swift Proxy Server Usuários finais que necessitam interagir com uma infraestrutura do Swift, precisam comunicar-se com um servidor “Proxy Server”, que, por sua vez, consulta os demais componentes do Swift. As requisições para o Proxy são feitas através de APIs (para criar, manipular ou remover objetos), ou utilizando o protoloco HTTP nativo (como a leitura de arquivos). Sua principal função é verificar a localização dos nós responsáveis por armazenar os “objects”, “containers” ou “accounts”, e rotear as requisições para cada respectivo nó. Além de possuir um sistema de cache através da utilização do “memcached”43, o “Proxy Server” também efetua um tratamento de falhas das requisições efetuadas. Por exemplo, se um determinado usuário efetua a leitura de um arquivo, o Proxy irá consultar o nó que possui a cópia do arquivo e, se este estiver indisponível, tenta o próximo nó que também possui uma cópia deste arquivo. Openstack (2012d). 3.4.3.2 Swift Object Server O “Swift Object Server” é o componente que gerencia objetos (arquivos binários) nos servidores que possuem discos de armazenamento. Ele é responsável por guardar, recuperar e apagar estes objetos em seus discos locais. Estes objetos 43 http://memcached.org 79 são alocados em um sistema de arquivos locais que tenham suporte para estruturação dos dados (metadata), utilizando atributos estendidos (xattrs)44. O “Object Server” suporta diversos tipos de sistemas de arquivos que suportem atributos “xattrs”, embora recomende a utilização do sistema de arquivos XFS45. Também é importante ressaltar que em um cluster do Swift, vários nós do “Object Server” possuem cópias de objetos de outros nós, criando, desta forma, um sistema redundante. Nativamente, o “Object Server” replica um objeto em três nós distintos. Openstack (2012d). 3.4.3.3 Swift Container Server O “Swift Container Server” mapeia os objetos em uma lista, permitindo informar os objetos de cada “Container Server”. As listas são gravadas como arquivos de banco de dados SQLite. Além disso, ele fornece estatísticas de utilização, como o número total de objetos, quantidade de utilização, armazenamento total do recipiente, entre outros. Assim como o “Object Server”, ele efetua a replicação dos mapeamentos em diferentes nós. Openstack (2012d). 3.4.3.4 Swift Account Server Similar ao “Container Server”, o “Account Server” mapeia os containers de respectivas contas de usuários. Assim como os outros componentes, também efetua a replica dos dados em diferentes nós. Openstack (2012d). 3.4.3.5 The Ring O anel (Ring) contém informações da localização física dos objetos gravados no Swift e são repassadas para o servidor Proxy. É uma representação virtual do mapeamento dos nomes das entidades para sua localização física real. Ele é análogo ao serviço de indexação de um sistema de arquivos, por exemplo. Os componentes Account, Container e Object possuem seus próprios anéis, ainda que possam estar distribuídos em um mesmo conjunto de nós. Openstack (2012d). 44 45 xattrs - Filesystems support extended attributes http://xfs.org 80 O anel mantém um mapeamento utilizando conceitos de zona, dispositivos, partições e réplicas. Na configuração nativa do Swift, cada partição do anel é replicada para mais duas partições ao longo do cluster, e o mapeamento de uma partição virtual em discos físicos é mantida também pelo anel. Os dados também podem ser isolados utilizando um conceito de zonas, possibilitando que cada réplica de uma partição esteja alocada em uma diferente zona, garantindo a disponibilidade dos dados em uma eventual pane de uma localidade. Openstack (2012d). Por exemplo, cada servidor físico possui um número de discos. Ao longo do cluster, estes discos são divididos em pequenas partições virtuais de mesmo tamanho. Estas partições virtuais, em conjunto, irão formar o anel, garantindo a indexação dos objetos e a réplica dos dados. A figura abaixo exemplifica um anel formado por partições virtuais, com réplica de três nodes. Para adicionar um novo disco, o anel movimenta algumas partições virtuais e disponibiliza novas partições para serem utilizadas. Danjou (2012). Figura 15 - Exemplo de anel utilizado no OpenStack Swift. Fonte: Editado pelo autor com base em Riak (2012) O Swift também possui alguns processos que garantem a segurança dos dados (disponibilidade, integridade e confiabilidade). O processo “replication”, 81 através da aplicação rsync46, garante a replicação íntegra dos dados entre os nós virtuais, quando erros de rede ou de disco ocorrem. O processo “updaters” garante a atualização dos “containers” ou “accounts” quando não é possível efetuar uma atualização imediata. O processo “auditors” efetua periodicamente a checagem de integridade dos “objects”, “containers” e “accounts” e replica os dados para um determinado nó virtual, se erros forem encontrados. 3.4.4 Openstack Imaging Service (Glance) O Glance provê serviços para a descoberta, registro e a recuperação de imagens de máquinas virtuais de diferentes formatos. Formado pelos componentes glance-api e glance-registry, ele mantém um catálogo e o repositório das imagens, disponibilizando para que o nova-compute inicie instâncias de máquinas virtuais. A imagem a seguir, exibe a arquitetura lógica do Glance. Figura 16 - Arquitetura lógica do OpenStack Glance. Fonte: Glance Architecture (2012) 46 - Aplicação para a replicação de dados - rsync.net 82 3.4.4.1 Glance-api Assim como o nova-api, o componente glance-api é uma interface que interage com as requisições dos usuários e com os dispositivos de armazenamento, conforme é possível observar na imagem anterior. A imagem exemplifica a conexão do glance-api com clientes, com o glance-registry e com o “Store Adapter”47. Glance (2012) O glance-api pode armazenar imagens nos seguintes dispositivos ou sistemas: Swift (OpenStack); Filesystem (armazenamento local); S3 (serviço da Amazon AWS); HTTP (apenas leitura de imagens via HTTP). Outra característica relevante do glance-api é a possibilidade de realizar o cache de imagens. Imagens utilizadas recentemente são armazenadas em um cache local do servidor glance-api, possibilitando que outros servidores de API efetuem uma rápida leitura, garantindo uma maior escalabilidade para o fornecimento das imagens. Openstack (2012j) Para que seja possível entender o processo de gerenciamento de imagens, um exemplo será citado. Um usuário deseja enviar uma imagem para o Glance, do qual utilizará posteriormente para a execução de algumas máquinas virtuais. Através de uma interface web (Horizon), ou através da execução direta de uma chamada ao glance-api, ele realiza o upload de uma imagem de um sistema operacional. Durante o processo de upload, o usuário irá aguardar até que a imagem enviada esteja no estado “active”, no qual estará pronta para ser utilizada pelo componente Nova. No quadro abaixo, são citados os possíveis estados das imagens gerenciadas pelo Glance: Quadro 4 - Estados de uma imagem no Glance. Estado Descrição 47 Classe do Python do Glance (glance.store.Backend) que realiza a comunicação com os sistemas de armazenamento. 83 queued Um identificador foi criado para a imagem, mas ainda não foi iniciado o processo de upload. saving A imagem está sendo enviada para o armazenamento. Active A imagem está pronta para ser utilizada. Killed Um erro ocorreu no envio da imagem e não está disponível. Os dados da imagem foram removidos, mas o Glance manteve a informação sobre a imagem. Será removida em momento deleted oportuno. Um processo para apagar a imagem foi iniciado, porém não foi concluído. Neste estado, é possível cancelar o processo e pending_delete recuperar a imagem. Fonte: Elaborado pelo autor com base nas informações do Openstack (2012i). 3.4.4.2 Glance-registry O glance-registry é um serviço que efetua o mapeamento das imagens com os respectivos dispositivos de armazenamento. Ele condiciona as informações em um banco de dados SQLite ou MySQL. Openstack (2012i). 3.4.4.2 Formato de Discos e Containers As imagens enviadas para o Glance podem ser classificadas como formato de disco ou formato de container. O formato de disco de uma imagem é o mesmo do formato do disco original de onde ela foi produzida originalmente. Já o formato container, contém, além do disco original da máquina, um arquivo de metadados com informações sobre os requerimentos da máquina virtual, utilizado normalmente pelos hypervisors. Os quadros abaixo descrevem os tipos de imagens e containers suportados pelo OpenStack. Openstack (2012i). Quadro 5 - Tipos de imagens suportados pelo Glance. Formato raw vhd vmdk Descrição Formato de imagem de disco não estruturado. Formato de imagem padrão utilizado por VMWare, Xen, Microsoft, VirtualBox, e outros hypervisors. Outro formato padrão utilizado por diversos hypervisors. vdi Formato de imagem suportado pelos hypervisor VirtualBox e emulador QEMU. 84 iso Formato de imagem que contém dados de um disco óptico (CDROM). qcow2 Formato de imagem de disco suportado pelo emulador QEMU que pode expandir dinamicamente e suportar "copy on write". aki ari ami Formato de imagem da Amazon AWS. O AKI (Amazon Kernel Image) é análogo à imagem do kernel, padrão do sistema Linux (vmlinuz). Formato de imagem da Amazon AWS. O ARI (Amazon Ramdisk Image) é análogo ao initrd/initramfs, responsável por ler os módulos iniciais do boot do sistema Linux. Formato de imagem da Amazon AWS. O AMI (Amazon Machine Image) contém módulos e a imagem do kernel Linux em um mesmo arquivo. Fonte: Elaborado pelo autor com base nas informações de Openstack (2012i). Quadro 6 - Tipos de containers suportados pelo Glance. Formato ovf bare aki Ari Ami Descrição O Open Virtualization Format é um formato aberto de imagem para ser utilizado por diferentes hypervisors. Indica que nenhum container ou metadados existe para esta imagem. Formato padrão da Amazon, que pode conter algumas pequenas informações na imagem. Formato padrão da Amazon, que pode conter algumas pequenas informações na imagem. Formato padrão da Amazon, que pode conter algumas pequenas informações na imagem. Fonte: Elaborado pelo autor com base nas informações de Openstack (2012i). 3.4.5 OpenStack Identity Service (Keystone) O Keystone realiza o controle de políticas de identidade e acesso para todos os componentes do OpenStack. Com o Keystone é possível realizar a autenticação de um usuário, garantindo que uma solicitação vem realmente de quem ele diz ser, e garantindo, também, a sua autorização, assegurando que ele terá acesso apenas aos serviços que está de fato solicitando. O Keystone possui sua própria API baseada no REST API, a Indentity API. Com ela todos os componentes do OpenStack, inclusive usuários, realizam a interação para autenticar e autorizar diversas ações. O Keystone Identity tem três principais funções: Openstack (2012e). 85 gerenciamento de usuários: mantém cadastro de usuários autenticando e autorizando a realizarem ações; serviço de Catálogo: Possui uma lista de serviços associados aos componentes do OpenStack e que estão à disposição dos usuários; serviço de Políticas: Realiza o gerenciamento de serviços para o acesso específico de usuários e ou grupos. A autenticação de usuários no Keystone pode ser realizada de duas formas diferentes, baseado na utilização de usuário/senha ou através de um token48. É importante citar, também, que alguns componentes do Keystone foram estabelecidos, conforme listados abaixo: Openstack (2012e). endpoints: são considerados endpoints, cada componente do Openstack (Nova, Swift ou Glance) que está instalado em uma porta e um endereço dedicado; regions: é definido como regions toda localização física dedicada em um datacenter, como um servidor ou centro de dados dedicado; user: representação digital de um cliente de um serviço do OpenStack; services: cada componente do Openstack (Nova, Swift, Glance, outros) que está conectado, ou sendo administrado pelo Keystone; role: uma role é uma regra, ou conjunto de regras que podem ser associadas a diferentes usuários; tenant: é um projeto, grupo ou a associação de regras e endpoints para um determinado usuário inquilino. A imagem a seguir exemplifica o fluxograma de uma solicitação de criação de serviço através de um usuário validado pelo Keystone. 48 Token – Chave eletrônica utilizada para autenticação. 86 Figura 17 - Processo para criação de um serviço validado pelo Keystone. Fonte: Elaborado pelo autor com base em Openstack, (2012c) 3.4.5.1 Base de Dados O Keystone pode utilizar os serviços de banco de dados SQLite ou MySQL para armazenar informações de usuários e senhas, mas também pode utilizar uma base de LDAP (Lightweight Directory Access Protocol) existente. Openstack (2012e). 3.4.6 Openstack Administrative Web-Interface (Horizon) Horizon é um componente que disponibiliza um painel de administração de serviços do Openstack, através de uma interface web escrita em Python, conforme pode ser observado na imagem a seguir. Ele pode ser utilizado tanto para usuários finais que irão gerenciar apenas volumes e instâncias, como para o administrador do ambiente, que necessita de configurações avançadas do ambiente. A aplicação comunica-se com os demais componentes do OpenStack através de chamadas específicas de cada API, permitindo diversas ações entre usuários e os respectivos componentes. Disponibilizado para acesso ao púbico via protocolo HTTP pelo 87 módulo mod_wsgi49 em conjunto com o Apache50, fornece diversas funcionalidades, conforme seguem: gerenciamento de instâncias: o Horizon possibilita a execução ou término de instâncias, o acesso de máquinas por VNC, o anexo de volumes, o uso de variáveis, entre outros; acesso e Gestão de Segurança: possibilita a criação de grupos de segurança, par de chaves para acesso, atribuição de ips flutuantes, entre outros; gerenciamento de perfis instâncias: possibilita criar e apagar modelos de máquinas virtuais; gerenciamento de imagens: permite editar ou apagar imagens de máquinas virtuais; gerenciamento de usuários: fornece meio para a criação de usuários, quotas e atribuições ao inquilino. gerenciamento de volumes: suporte para criar volumes e fotos do estado de máquinas virtuais (snapshots); manipulação do Object Store: possibilidade de criar e apagar containers e objetos. 49 Módulo que suporta a execução da linguagem Python. http://code.google.com/p/modwsgi/ 50 Aplicação para hospedagem de serviços web. http://httpd.apache.org 88 Figura 18 - Tela de gerenciamento de instâncias do Horizon. Fonte: Editado pelo autor com base em Openstack (2012e). 3.5 ANÁLISE DO EUCALYPTUS E OPENSTACK Eucalyptus e OpenStack são soluções existentes com a proposta de fornecer um sistema capaz de orquestrar um ambiente para a nuvem. A melhor definição para descrever o Eucalyptus, é a afirmativa de ser uma plataforma IaaS que possibilita a criação de um projeto escalável de nuvem híbrida e/ou privada, utilizando a infraestrutura de TI existente nas próprias empresas. EUCALYPTUS SYSTEMS (2012a, pag. 4). Da mesma forma, segundo OPENSTACK (2012a), o OpenStack é um sistema que possibilita o fornecimento de serviços de IaaS em uma nuvem pública ou privada, utilizando código de software aberto. Para obter um melhor comparativo entre as duas plataformas e delinear quais as aplicabilidades de cada solução, um quadro comparativo entre os dois sistemas foi desenvolvido, apresentando as suas principais características. É importante ressaltar, que as informações do quadro a seguir foram retiradas da documentação oficial dos próprios sistemas. Entretanto, algumas características do Eucalytptus não foram localizadas na documentação oficial, que é um tanto vaga na descrição de seus componentes internos. 89 Quadro 7 - Comparativo de características entre OpenStack e Eucalyptus. Tipo de Serviço Arquitetura Recomendada Início Desenvolvimento Licença Versão atual estável Armazenamento Persistente (EBS) Armazenamento Objetos (EC3) Hypervisors API Banco Dados Drivers Autenticação Altorítmo de escalonamento Compatibilidade EC2/S3 Alta Disponibilidade Movimentação instâncias tempo real Configuração de rede para instâncias Sistema Operacional Hospedeiro Principais participantes Linguagem Programação Periodicidade de versões Autenticação p/ conexão à instância OpenStack IaaS Público/Privado 2010 Apache v2 Essex Nova-volume Swift Xen, XenServer, KVM, Qemu, Hyper-V, VMware, UML Própria e padrão euca2ools MySQL, Postgress e SQLite LDAP/AD Sim, nova-scheduler Sim Depende do componente Sim VLAN, DHCP, pelo sistema Eucalyptus IaaS Privado 2008 Proprietário / GPLv3 V2.1 Storage Controller (CC) Walrus Xen, KVM, VMware Padrão euca2tools Não localizado LDAP/AD Sim Sim Depende do componente Não localizado Estático, DHCP e VLAN Ubuntu, Fedora, CentOS, Ubuntu, RHEL, CentOS, Fedora OpenSuse, Debian RackSpace, Nasa, Dell, HP, TrendMicro, Nasa, F5, NTT RedHat, IBM, Microsoft, etc. Data, Sony, Cloudera, etc. Python Java, C, Python 6 meses Não definido Chaves SSH Chaves SSH Fonte: Criado pelo autor com base em Openstack (2012b), Openstack (2012c), Eucalyptus (2012a), Eucalyptus (2012b), Eucalyptus (2012c). 90 4 PROJETO PRÁTICO E RESULTADOS OBTIDOS Este capítulo tem o intuito de apresentar o método e as técnicas que foram utilizados para a construção e elaboração da implantação. O estudo deste capítulo foi realizado utilizando métodos de pesquisa e métodos experimentais, dos quais foram utilizados para coletar dados e realizar análises do projeto implantado. A construção de uma pesquisa, de acordo com Prodanov (2003), requer uma série de regras visando a atingir um determinado conhecimento. Estas regras são necessárias para garantir ao trabalho científico um alto grau de confiabilidade, comprovação das afirmações realizadas e consequentemente conclusões baseadas em dados reais. A pesquisa experimental objetiva apresenta o modo ou as causas pelas quais um determinado fenômeno é produzido. Para atingir os resultados propostos, o pesquisador faz uso de instrumentos de verificação apropriados e capazes de tornar perceptíveis as relações existentes entre as variáveis envolvidas no objeto de estudo. Conforme Malhotra (2004, p. 217) pode-se caracterizar um experimento quando “o pesquisador manipula uma ou mais variáveis independentes, mede o seu efeito sobre uma ou mais variáveis dependentes ao mesmo tempo em que controla o efeito sobre variáveis estranhas”. A seguir, será apresentando a proposta do ambiente implantado, os métodos de coleta dos dados e a sua posterior análise. 4.1 AMBIENTE DA PROPOSTA DE TRABALHO A proposta do ambiente será utizar os componentes Nova e Glance do projeto OpenStack versão ESSEX, para prover uma infraestrutura necessária para a coleta e análise de dados. O Swift, componente para o armazenamento de objetos do OpenStack, não será implantado pela necessidade de ser instalado em um ambiente com maiores recursos computacionais. O ambiente utilizado, foi um computador Dell Inspiron 1525 da marca DELL51, com 4GB de memória RAM e um processador CPU INTEL Core 2 DUO com 2.2GHZ, juntamente com o sistema operacional hospedeiro Ubuntu 11.10 64 bits e o 51 http://www.dell.com.br 91 sistema de virtualização Virtualbox 4.1.6, duas máquinas virtuais foram instaladas para serem utilizadas como base para a instalação dos componentes do OpenStack. O Virtualbox será utilizado como a primeira camada de virtualização das máquinas na nuvem, por prover uma interface simples e intuitiva e por possuir uma ótima integração com o sistema operacional hospedeiro (Ubuntu 11.10). Este ambiente é melhor compreendido, na ilustração da imagem 19. 4.1.1 Requisitos da infraestrutura O quadro abaixo apresenta o ambiente necessário para a instalação da infraestrutura. É importante salientar, que as duas máquinas virtuais precisam ser instaladas com o sistema operacional Ubuntu 12.04, o qual tem a melhor compatibilidade com a versão atual do Openstack. Apesar da utilização do Ubuntu, o Openstack possibilita também a instalação em outros tipos de sistemas operacionais, de acordo com o apresentado no quadro 7. Quadro 8 - Requisitos dos servidores para a estrutura. cloud01 Sistema Ubuntu Server 12.04 64 bits Disco 20GB Memória 1.5GB Rede NAT eth0 (dhcp) Rede Pública eth1 (192.168.56.2) Rede Privada eth2 (vlan) Fonte: Criado pelo autor. cloud02 Ubuntu Server 12.04 64 bits 20GB 1GB eth0 (dhcp) eth1 (192.168.56.3) eth2 4.1.2 Arquitetura do ambiente Conforme apresentado no quadro anterior, a estrutura proposta necessita de duas máquinas virtuais com o sistema operacional Ubuntu Server 64 bits e com três interfaces de rede para cada máquina. A primeira interface será utilizada para buscar os pacotes do Openstack na internet e manter as atualizações futuras. A segunda interface será utilizada para a comunicação entre os componentes do Openstack e para disponibilizar endereços ips flutuantes para as instâncias criadas. A terceira interface será utilizada para vincular interfaces virtuais (com VLAN) entre o nova- 92 compute e as instâncias virtuais criadas. A criação das interfaces em VLAN será de responsabilidade do nova-compute, que as criará conforme a demanda. A imagem abaixo demonstra a arquitetura externa do ambiente, sem a inclusão detalhada dos componentes do Openstack. Embora não seja obrigatório, é recomendável que o processador possua suporte de virtualização por hardware, otimizando desta forma o ambiente a ser instalado. Figura 19 - Estrutura externa do ambiente proposto. Fonte: Criado pelo autor. A imagem a seguir, ilustra o ambiente instalado com uma visão direta para os componentes do OpenStack. Conforme é possível observar na ilustração citada, o primeiro servidor terá instalado todos os componentes do Openstack. Já o segundo servidor, terá apenas os componentes nova-compute e nova-network instalados, formando um ambiente conhecido como multi-node. Em um ambiente multi-node, mais de um host pode ser utilizado para instanciar máquinas. É importante ressaltar, que não existe obrigatoriedade na instalação do componente nova-network no segundo servidor, ele apenas será instalado desta forma por acreditar-se na melhora do desempenho da rede e por garantir uma redundância para o serviço novanetwork, embora precise estar definido para tal ação. Outra característica relevante na imagem a seguir, é o fato de existir apenas o sistema Qemu para a função de hypervisor. Esta limitação ocorre no ambiente 93 proposto, por não ser possível a execução de outro tipo de hypervisor além do Qemu, quando este mesmo hypervisor já estiver em execução sob um tipo de sistema de virtualização. Neste ambiente apresentado, o sistema de virtualização VirtualBox já utiliza os benefícios da virtualização assistida por hardware, que também é exigido para a utilização de outros sistemas como KVM, Xen, Vmware ESX, entre outros. Figura 20 - Estrutura externa do ambiente proposto. Fonte: Criado pelo autor. 4.1.3 Processo de Instalação Como o processo de instalação exige uma grande quantidade de ações e comandos a serem realizados, ele foi descrito integralmente no apêndice A deste trabalho. 94 4.2 COLETA DE DADOS DO AMBIENTE Nesta sessão serão apresentados os testes realizados a fim de obter dados para a análise e compreensão dos resultados. Após a implantação do ambiente, duas instâncias virtuais idênticas foram criadas. Uma foi iniciada pelo nó cloud01 e outra foi iniciada pelo nó cloud02. Em seguida, testes e simulações de falhas nos serviços foram executados. 4.2.1 Testes de Latência de Rede X Testes de Troca de Tráfego Este teste buscou verificar a latência e a capacidade de troca de tráfego das instâncias gerenciadas pelo OpenStack. Para a captação destes dados, os utilitários iperf52 e ping53 foram utilizados de modo a mensurar a capacidade máxima de troca de tráfego e a latência para a comunicação com as instâncias. Em uma situação de trabalho normal (sem a utilização de recursos computacionais), foram disparados da máquina hospedeira Ubuntu 11.10 (aqui atuando como um cliente da instância) sessenta pacotes ICMP (Internet Control Message Protocol) em três diferentes momentos, para as duas instâncias em execução, sendo uma instância por vez. Da mesma forma, o iperf foi executado em três momentos distintos, como forma de obter a capacidade máxima de troca de tráfego entre a máquina hospedeira (cliente) e a instância executada. Em um segundo momento, os testes de latência e tráfego foram realizados concomitantemente nas duas máquinas virtuais, gerando novas informações para a coleta. 4.2.2 Testes de Leitura e Gravação de Dados Assim como nos testes de rede do OpenStack, coletados anteriormente, também foram realizados testes na gravação e leitura de dados nos discos locais das instâncias e no sistema de arquivos criado a partir de um volume do OpenStack. Utilizando o comando tiotest da suíte tiobench54, foram executados testes de 52 Iperf – Utilitário para mediar a capacidade máxima de troca de tráfego entre dois pontos. http://sourceforge.net/projects/iperf 53 Ping – Utilitário que verifica o tempo de resposta da comunicação de rede entre dois pontos. 54 Tiobench – Utilitário para coleta de dados de desempenho de discos. http:// sourceforge.net/projects/tiobench 95 gravação e leitura dos dados de forma sequencial e randômica. Um total de seis testes foram executados nas duas instâncias e nos seus respectivos volumes de forma isolada. Posteriormente, três testes foram também executados, porém de forma simultânea. Como saída, foram retornados valores de capacidade máxima de gravação e a latência total de cada operação. 4.2.3 Simulação de falhas nos serviços do Nova Com o ambiente do OpenStack instalado e em execução, o serviço novacompute, nova-scheduler, nova-network, nova-volume, nova-compute, nova-network Iptables, MySQL, RabbitMQ, e o Keystone foram parados para simular um falha geral e obter dados sobre o comportamento do ambiente. Por meio do comando “nova-manage service list”, é possível observar o estado dos componentes do Nova, se ativo ou inativo, conforme quadro ilustrado abaixo. A simulação de parada de todos os serviços foi executada por meio dos seus respectivos scripts localizados em “”/etc/init.d/” do nó cloud01. Tabela 3 - Lista de serviços ativos e inativos do Nova. Binary nova-compute nova-scheduler nova-network nova-volume nova-compute nova-network Host cloud01 cloud01 cloud01 cloud01 cloud02 cloud02 Zone nova nova nova nova nova nova Status enabled enabled enabled enabled enabled enabled State XXX :-) :-) :-) XXX :-) Updated_At 10/06/2012 10/06/2012 10/06/2012 10/06/2012 10/06/2012 10/06/2012 00:38:14 00:45:07 00:45:07 00:45:07 00:44:11 00:45:07 Fonte: Criado pelo ator. 4.3 ANÁLISE DOS DADOS OBTIDOS Nesta sessão, serão descritos os resultados obtidos a partir da análise dos dados coletados. 4.3.1 Da latência e desempenho da rede Após a coleta dos dados, foi realizado um cálculo aritmético de soma e média dos valores obtidos nos testes individuais e coletivos, resultando na tabela e gráfico 96 ilustrados a seguir. Os valores de latência e taxa média são exibidos em segundos e Mbits, respectivamente. Percebe-se que o fator de uso simultâneo afeta outras instâncias executadas em uma mesma zona do OpenStack e que compartilha os mesmos recursos. Tabela 4 - Tabela do resultado da análise dos dados de rede. Sem tráfego Com tráfego Latência mínima (s) 1,073 1,378 Latência média (s) 9,206 29,102 48,779 265,039 Latência máxima (s) Taxa Média (Mbits) Individual Simultâneo 16 10,5 Fonte: Criado pelo ator. Figura 21 - Gráfico do resultado da análise dos dados de rede. Fonte: Criado pelo ator. 4.3.2 Da latência e velocidade das operações de disco Assim como nos testes de rede, após a coleta dos dados, foi realizado um cálculo aritmético de soma e média dos valores obtidos nos testes individuais e coletivos, resultando na tabela e gráfico ilustrados a seguir. Nesta análise, constam os comparativos de operações individuais na instância, operações individuais no 97 volume e operações simultâneas (duas instâncias ao mesmo tempo). Com base nos valores apresentados e na interpretação do gráfico, é possível observar que o fator de uso simultâneo, descrito neste trabalho como “multi-inquilino” pode afetar os demais usuários na nuvem. Também pode-se observar, que as operações realizadas diretamente na instância do OpenStack, possuem um desempenho muito superior se comparado à operações realizadas diretamente no volume. É claro que, estes valores foram obtidos por meio de uma plataforma que não é dedicada para o serviço de armazenamento, e podem estar distorcidos frente à utilização de equipamentos especializados para o armazenamento de dados. Os valores de tempo e taxa são exibidos em segundos e MBytes, respectivamente. Já os valores de latência média, são apresentados em milissegundos. Tabela 5 - Valores de desempenho das operações de leitura e escrita. Write 40MBs Random Write 16 MBs Read 40 MBs Random Read 16 MBs Teste Simples Instância Teste Simples Vol Teste Simultâneo Vol Tempo (s) Taxa (MB/s) Tempo (s) Taxa (MB/s) Tempo (s) Taxa (MB/s) 2,59 15,63 22,20 3,20 32,50 1,44 Média (ms) Latência Média 2,36 0,31 6,69 123,07 10,78 1,83 1,48 25,42 16,77 3,00 0,99 22,19 0,20 85,92 0,77 25,61 1,55 24,40 Máximo Média Máximo Média Máximo (ms) (ms) (ms) (ms) (ms) 0,36 83,28 1,26 386,70 2,93 1992,80 Fonte: Criado pelo ator. 98 Figura 22 - Gráfico de desempenho das operações de leitura e escrita. Fonte: Criado pelo ator. 4.3.3 Da análise da disponibilidade dos componentes A partir dos dados obtidos com a parada planejada dos serviços do OpenStack, e do estudo dos materiais disponibilizados pelo projeto OpenStack, uma análise foi realizada sobre cada componente do OpenStack. Por exemplo, ao parar o componente nova-compute, foram feitas verificações como: se instâncias eram afetadas, ou se a conectividade era interrompida, entre outros testes. Como o comportamento de cada componente é diferente, eles foram registrados, analisados e sumarizados em uma tabela que mede o fator de disponibilidade para cada serviço e que fazem parte diretamente ou indiretamente do Openstack. No quadro a seguir, é possível visualizar o estudo realizado. É possível verificar, que componentes como o Keystone e o Iptables que tem um alto grau de importância para a arquitetura do OpenStack. A tabela foi criada a partir da visão de cada componente sobre um determinado sujeito. Por exemplo, o impacto do Keystone sobre a ativação de uma nova instância é alto, em razão de ele ser um concentrador de risco, já que efetua a autenticação dos componentes do OpenStack. 99 Quadro 9 - Gráfico de desempenho das operações de leitura e escrita. Disponibilidade Instância Nova Volume Novo Sistema Ativa Instância ativo Volume Openstack Objeto Keystone Alto Alto Alto Alto Iptables Alto Alto Alto Virtualizador Alto Alto Baixo Nova-compute Alto Alto Alto Nova-network Alto Alto Nova-api Alto Baixo Alto Nova-scheduler Alto Alto Alto Swift Proxy Server Alto Alto RabbitMQ Server Alto Alto Alto MySQL Alto Alto Alto Iscsi Server Baixo Alto Alto Médio Glance-api Alto Baixo Glance-registry Alto Baixo Nova-volume Baixo Alto Médio Swift Object Server Baixo Baixo Swift Container Server Baixo Baixo Swift Account Server Baixo Baixo Horizon Baixo Baixo Nova-objectserver Baixo - Fonte: Criado pelo ator. Impacto Total 12 9 7 6 6 6 6 6 6 6 6 4 4 3 2 2 2 2 1 100 5 CONCLUSÃO A Computação nas Nuvens é uma grande evolução na era da Tecnologia da Informação. O assunto ainda é muito recente, mas ao mesmo tempo cresce de forma acelerada, principalmente pela promessa de redução de custos com TI e melhoria nos serviços computacionais. Nos últimos anos, foi possível observar o crescimento dos conceitos de virtualização e armazenamento centralizado, que assim como a computação nas nuvens, carecia de maiores estudos e testes com as novas tecnologias. Neste momento, o que pode-se observar é grandes empresas esforçando-se ao máximo para oferecer, de alguma forma, serviços computacionais sob demanda. Dentro desta perspectiva, a computação nas nuvens deixa de ser uma promessa para ingressar na realidade atual dos usuários e corporações. Apesar do crescimento vertiginoso dos serviços prestados na nuvem, constatou-se que empresas e usuários ainda possuem insegurança quando o assunto é alocar informações confidenciais em um ambiente controlado por terceiros. Observou-se, que a utilização de serviços computacionais sob demanda, por parte de empresas, começa primeiramente com sistemas de menor criticidade. Ao longo do tempo, com o amadurecimento sobre os conceitos da nova tecnologia, as empresas acabam por hospedar na nuvem sistemas de maior criticidade. Pelo lado de usuários domésticos, percebeu-se que a utilização da tecnologia é inclusive maior que nas empresas, por meio da utilização de serviços já conceituados como o e-mail, a hospedagem de arquivos pessoais, fotos, músicas, entre outros. Se por um lado temos a utilização dos serviços por parte de consumidores, temos do outro lado os prestadores de serviços de nuvem, que necessitam de soluções para fornecer um serviço seguro, eficaz e com qualidade. Diante deste cenário, o objeto de estudo deste trabalho foi apresentar a conceituação sobre computação nas nuvens e buscar soluções que se propusessem a oferecer uma solução para o gerenciamento de uma infraestrutura computacional. Desta forma, o seguinte questionamento fora realizado na definição de pesquisa deste trabalho: é possível que uma plataforma de software aberto, no esforço de seus colaboradores mundiais, consiga apresentar uma solução segura e eficaz, que possa controlar e gerenciar a infraestrutura de diferentes soluções de virtualização e de 101 armazenamento de forma a oferecer serviços de IaaS, além de agregar maior segurança para a computação nas nuvens? Durante a pesquisa, foi possível encontrar diversas soluções de infraestrutura de nuvem, mas com diferentes focos de trabalho. Enquanto que algumas soluções proprietárias são totalmente fechadas e possuem pouco suporte para a integração com outras plataformas, as soluções de código aberto apresentam grande integração com diferentes sistemas e demonstram grandes potenciais para o crescimento em um ambiente repleto de sistemas de diferentes fabricantes e arquiteturas. Como o foco desta pesquisa estava em buscar soluções de código aberto para o gerenciamento do ambiente na Nuvem, foram realizadas análises entre as soluções OpenStack e Eucalyptus. A partir da análise dos dados coletados, percebeu-se que o Eucalyptus é uma solução madura, com utilização por parte de grandes empresas e integra-se com sistemas de armazenamento e virtualização. Entretanto, o número reduzido de suporte para os sistemas de virtualização e a sua política interna de fornecer uma solução de código proprietário e outra de código aberto, tende a deixar o Eucalyptus em desvantagem se comparado diretamente com o OpenStack. Esta divisão acaba por afastar grandes corporações interessadas em participar do projeto, ou mesmo desenvolver integrações com a plataforma, principalmente pela razão de problemas com “vendor lock-in”. Entende-se, que pela diversidade de tipos de soluções computacionais que formam o entorno da nuvem, um sistema de código fechado não consegue acompanhar o ritmo acelerado do surgimento de novos sistemas, do qual precisará integrar-se posteriormente. O OpenStack surgiu a partir de um esforço de diversas corporações engajadas no desenvolvimento de uma nova solução para a nuvem e que estivessem alinhadas com as necessidades de todos os seus participantes. Por meio do experimento realizado e através da análise dos dados obtidos, percebe-se que o OpenStack é uma solução muito robusta e com uma grande capacidade de expansão horizontal, possibilitando que o investimento da infraestrutura ocorra conforme a demanda dos serviços que disponibiliza. Apesar das falhas encontradas na aplicação durante a fase de implantação e dos problemas de pontos únicos de falhas em sua estrutura do qual foram relatados, é totalmente 102 possível que empresas utilizem o OpenStack como base para fornecer serviços de IaaS próprios. É importante mencionar, que no decorrer do trabalho, diversas dificuldades foram encontradas. A documentação do OpenStack é muito nova, e por vezes está desatualiza frente ao rápido desenvolvimento da aplicação. Por possuir uma arquitetura complexa, a falta de documentação ou a sua falta de atualização, acaba dificultando o entendimento dos seus conceitos e componentes. Também é possível relatar, a dificuldade encontrada em instalar o ambiente com poucos recursos tecnológicos disponíveis. Por esta razão, testes de análises de desempenho podem ter sido influenciados pela falta de isolamento entre as camadas da virtualização. Estes testes, poderiam ser mais apurados se estivessem em um ambiente de produção, com máquinas dedicadas para as tarefas do OpenStack e dos sistemas de virtualização. Espera-se que este trabalho, possa ser utilizado como fonte de estudo e inspiração para novos projetos de computação nas nuvens. Apesar dos estudos serem projetados em um ambiente de homologação, eles podem ser aproveitados para a utilização na implantação de sistemas de produção. Academicamente, esta pesquisa também poderá ser utilizada como inspiração para a realização de novos trabalhos. A partir da documentação aqui presente, um sistema de instalação automática do OpenStack poderia ser desenvolvido de forma a facilitar a sua propagação em uma rede heterogênea. Outro trabalho interessante, seria a realização de um estudo mais aprofundado no componente Swift, buscando propiciar um ambiente para o armazenamento de grandes volumes de dados, utilizando uma estrutura formada por meio de anéis distribuídos. Um terceira opção seria o desenvolvimento de um sistema operacional completo, utilizando uma plataforma de Linux e o OpenStack e que poderia ser utilizado por empresas que necessitam oferecer ou mesmo consumir serviços computacionais na nuvem. Por fim, um trabalho poderia ser desenvolvido buscando estudar a garantia da alta disponibilidade dos componentes do OpenStack. 103 REFERÊNCIAS ABNT NBR ISO/IEC 27001:2005. Tecnologia da Informação – Técnicas de Segurança – Sistemas de gestão de segurança da informação - Requisitos. RIO DE JANEIRO: ABNT, 2006. ABNT NBR ISO/IEC 27002:2005. Tecnologia da Informação – Técnicas de Segurança – Código de Prática para a Gestão da Segurança da Informação. RIO DE JANEIRO: ABNT, 2005. AICPA. SAS 70. Disponível em: <http://sas70.com/sas70_overview.html>. Acesso em 06 mai 2012. AMAZON, AWS Cloud, 2011. Disponível em: http://aws.amazon.com/. Acesso em: 02/11/2011. AMAZON. EUCA2OOLS. 2012f. Disponível em <http://aws.amazon.com/pt/ebs/>. Acesso em 03 abr 2012. AMAZON. AWS. 2012c. Disponível em <http://aws.amazon.com/pt/>. Acesso em 03 abr 2012. AMAZON. EBS. 2012e. Disponível em <http://aws.amazon.com/pt/ebs/>. Acesso em 03 abr 2012. AMAZON. EC2. 2012a. Disponível em <http://aws.amazon.com/pt/ec2/>. Acesso em 03 abr 2012. AMAZON. History. 2012d. Disponível em <http://phx.corporateir.net/phoenix.zhtml?c=176060&p=irol-corporateTimeline>. Acesso em 03 abr 2012. AMAZON. S3. 2012b. Disponível em <http://aws.amazon.com/pt/s3/>. Acesso em 03 abr 2012. APACHE, Fundation. Apache License 2.0. Disponível <http://www.apache.org/licenses/LICENSE-2.0.html>. Acesso em 29 abr 2012. em: BLOKDIJK, Gerard; MENKEN, Ivanka. Virtualization Specialist Level Complete Certification Kit. Austrália, Emereo Publishin. 2009 104 CACTUS. OPENSTACK COMPUTE ADMINISTRATION MANUAL. Disponível em: http://docs.openstack.org/cactus/openstack-compute/admin/content/exampleinstallation-architecture.html. Acesso em: 01/11/2011. CLOUDSTACK. Disponível <http://www.citrix.com/English/ps2/products/product.asp?contentID=2314749>. Acesso em 29 abr 2012. em: CSA. Security Guidance v3.0. 2012b. Disponível em: <http://www.cloudsecurityalliance.org/guidance/csaguide.v3.0.pdf> Acesso em 14 mai 2012. CSA. Cloud Security Alliance. 2012a. http://cloudsecurityalliance.org/. Acesso em: 18/08/2011. Disponível em: CSA. Guia de Segurança 2.1 pt-br. 2012c. Disponível em: <https://cloudsecurityalliance.org/guidance/CSAGuidance-pt-BR.pdf>. Acesso em 14 mai 2012. DANJOU, Julien. OpenStack Swift eventual consistency analysis & bottlenecks. Disponível em <http://julien.danjou.info/blog/2012/openstack-swift-consistencyanalysis>. Acesso em 30 abr 2012. DELGADO, Victor. Exploring the limits of cloud computing, Masters Thesis. Kungliga Tekniska Högskolan. Stockholm, Sweden, 2010. EUCALYPTUS SYSTEMS, Installation Guide. Goleta, CA, 2012c. Disponível em <http://www.eucalyptus.com/sites/all/files/docs/3.0/ig.pdf>. Acesso em 03 mai 2012. EUCALYPTUS SYSTEMS. Administration Guide. Goleta, CA, 2012a. Disponível em: <http://www.eucalyptus.com/docs/3.0/ag.pdf>. Acesso em: 22 mai. 2012. EUCALYPTUS SYSTEMS. Euca2ools. 2012g Disponível http://open.eucalyptus.com/wiki/Euca2oolsUsing. Acesso em: 08/12/2011. em: EUCALYPTUS SYSTEMS. Story. Goleta, CA, 2012d. Disponível <http://www.eucalyptus.com/about/story>. Acesso em 22 mai 2012. em: EUCALYPTUS SYSTEMS. The Open Source Cloud Platform. . Goleta, CA, 2012e Disponível em: http://open.eucalyptus.com/. Acesso em: 10/08/2011. 105 EUCALYPTUS SYSTEMS. What Is. Goleta, CA, 2012b. Disponível em: <http://www.eucalyptus.com/learn/what-is-eucalyptus>. Acesso em: 22 mai. 2012. EUCALYPTUS SYSTEMS. Why. Goleta, CA, 2012f, Disponível <http://www.eucalyptus.com/learn/why-eucalyptus>. Acesso em 22 mai 2012. em: FSF. GPLv3. Disponível em: <http://gplv3.fsf.org>. Acesso em 29 abr 2012. GRANCE Timothy; MELL Peter. THE NIST DEFINITION OF CLOUD COMPUTING. Gaithersburg – USA. National Institute of Standards and Technology, 2011. Disponível em: <http://csrc.nist.gov/publications/nistpubs/800-145/SP800-145.pdf>. Acesso em 01 mai 2012. GUTWIRTH, Serge; POULLET, Yves; HERT, Paul De; LEENES, Ronald. Computers, Privacy and Data Protection: An Element of Choice. London: Springer, 2011. IBM. Cloud Computing. Disponível http://www.ibm.com/developerworks/br/library/l-cloud-computing/. Acesso 08/12/2011. em: em: IDC. Blog IDC Exchange. Disponível em: <http://blogs.idc.com/ie/?p=922>. Acesso em 06 mai 2012. ISO IEC 27001. Disponível em: <http://www.iso27001security.com/html/27001.html>. Acesso em 06 mai 2012. KVM. 2012a. Disponível em: <http://www.linux-kvm.org/>. Acesso em 19 mai de 2012. KVM. Kernel-based Virtual Machine. 2012b. Disponível em: http://www.linuxkvm.org/. Acesso em: 20/08/2011. LAKATOS, Eva Maria; MARCONI, Marina de Andrade. Metodologia Científica. São Paulo: Atlas, 1991. Fundamentos da MALHOTRA, Naresh K. Pesquisa de Marketing – uma orientação aplicada. 4ª Ed. São Paulo: Artmed Editora, 2004. 106 MATTOS, Diogo Menezes Ferrazani. Virtualização: VMWare e Xen. Rio de Janeiro, Disponível em: <http://www.gta.ufrj.br/grad/08_1/virtual/artigo.pdf>. Acesso em 17 mai 2012. MICHAELLIS, Moderno Dicionário da língua portuguesa. Disponível em: <http://michaelis.uol.com.br/moderno/portugues/>. Acesso em 21 mai 2012. MILLER, Michael. Cloud Computing: Web-Based Applications That Change the Way You Work and Collaborate Online. Indianapolis, Indiana: QUE, 2008 MIRANDA, Antonio Basílio; VIANA, Carlos Juliano Moura; HAEUSLER, Edward Hermann; LIFSCHITZ, Sérgio. Processamento de dados Semânticos na Cloud: um estudo de caso com o Protein World Database. ISSN 0103-9741[Monografias em Ciência da Computação]. RIO DE JANEIRO, 2011. NIMBUS, Nimbus Platform. 2012a. Disponível em: http://www.nimbusproject.org/. Acesso em: 05/12/2011. NIMBUS. Nimbus About. 2012b. Disponível <http://www.nimbusproject.org/about/>. Acesso em 22 mai 2012. em: NIMBUS. Nimbus Features. 2012c. Disponível em: <http://www.nimbusproject.org/docs/current/features.html> Acesso em 22 mai 2012. NURMI, D.; WOLSKI, R.; GRZEGORCZYK, C.; OBERTELLI, G.; SOMAN, S.; YOUSEFF, L.; ZAGORODNOV, D. "The eucalyptus open-source cloudcomputing system" in Proceedings of the 2009 9th IEEE/ACM International Symposium on Cluster Computing and the Grid-Volume 00, 2009. OLIVEIRA, Rômulo Silva; CARISSIMI, Alexandre da Silva; TOSCANI, Simão Sirineo. Sistemas Operacionais - 4ª Edição. Bookman Editora, 2010 OPENNEBULA. The Open Source Toolkit for Data Center Virtualization. Disponível em: http://opennebula.org/. Acesso em: 21/08/2011. OPENNEBULA.ORG. 2012a. Disponível em: <http://opennebula.org/>. Acesso em 22 mai 2012. OPENNEBULA.ORG. About the OpenNebula.org Project. 2012b. Disponível em: <http://opennebula.org/about:about>. Acesso em 22 mai 2012. 107 OPENSTACK. 2012a. Disponível em <http://openstack.org/>. Acesso em 01 abr 2012. OPENSTACK. Admin Guide Objectstorage. 2012d. Disponível em <http://docs.openstack.org/trunk/openstack-object-storage/admin/os-objectstorageadminguide-trunk.pdf>. Acesso em 23 abr 2012. OPENSTACK. Admin Guide. 2012e. Disponível em <http://docs.openstack.org/trunk/openstack-compute/admin/bk-compute-adminguidetrunk.pdf>. Acesso em 01 mai 2012. OPENSTACK. Glance Admin Guide. 2012i. Disponível <http://docs.openstack.org/diablo/openstack-image-service/admin/os-imageadminguide-diablo.pdf>. Acesso em 02 mar 2012. em OPENSTACK. Glance Architecture. 2012h. Disponível <http://glance.openstack.org/architecture.html>. Acesso em 24 mai 2012 em OPENSTACK. Glance Cache. 2012j. Disponível <http://glance.openstack.org/cache.html>. Acesso em 03 mai 2012. em OPENSTACK. Glance OpenStack Imaging Service. 2012g. Disponível em: http://glance.openstack.org/. Acesso em: 07/12/2011. OPENSTACK. Install Guide. 2012f. Disponível em <http://docs.openstack.org/trunk/openstack-compute/install/openstack-install-guidetrunk.pdf>. Acesso em 24 abr 2012. OPENSTACK. Overview. 2012b. Disponível em <http://openstack.org/downloads/openstack-compute-datasheet.pdf>. Acesso em 01 abr 2012. OPENSTACK. Starter Guide Essex. 2012c, Disponível <http://docs.openstack.org/essex/openstack-compute/starter/os-computestarterguide-trunk.pdf>. Acesso em 24 abr 2012. em OPENSTACK. Swift Storage Infrastructure. http://swift.openstack.org/. Acesso em: 07/12/2011. em: 2012l. Disponível 108 PCI. STANDARDS DOCUMENTS. Disponível em: <https://www.pcisecuritystandards.org/security_standards/documents.php?document =pci_dss_v2-0#pci_dss_v2-0>. Acesso em 06 mai 2012. PRODANOV, Cleber Cristiano. Manual de Metodologia Científica. 3. ed. Novo Hamburgo: Feevale, 2003. QEMU. 2012b. Disponível em: <http://wiki.qemu.org/>. Acesso em 20 mai 2012. QEMU. INTERNALS. 2012a. Disponível tech.html>. Acesso em 20 mai 2012. em: <http://qemu.weilnetz.de/qemu- REESE, George. Cloud Application Architectures - Bulding Applications and Infrastructure in the Cloud. Sebastopol, CA: O’Reilly, 2009. RFC3720, ISCSI - Internet Small Computer Systems Interface. Disponível em: http://www.ietf.org/rfc/rfc3720.txt. Acesso em: 07/12/2011. RIAK, Wiki, Disponível em <http://wiki.basho.com/What-is-Riak%3F.html>. Acesso em 30 abr 2012. SACKS, David. Demystifying Storage Networking - DAS, SAN, NAS, NAS Gateways, Fibre Channel, and iSCSI. San Jose – California – USA. IBM Storage Networking, 2001. Disponível em: <http://www03.ibm.com/industries/ca/en/education/k12/technical/whitepapers/storagenetworking. pdf>. Acesso em 21 mai 2012. SCHUBERT, Lutz. Expert Group Report. The Future Of Cloud Computing. Disponível em: <http://cordis.europa.eu/fp7/ict/ssai/docs/cloud-report-final.pdf>. Acesso em 01 mai 2012. SEMPOLINSKI, Peter; THAIN, Douglas. A Comparison and Critique of Eucalyptus, OpenNebula and Nimbus. IEEE International Conference on Cloud Computing Technology and Science, University of Notre Dame (2010) Sosinsky, Barrie. Cloud Computing Bible. Indianapolis: Wiley Publishing, Inc.,2011. SOTOMA OR, Borja; MONTERO, Rub n S.; LLORENTE, Ignacio M.; FOSTER, Ian. An Open Source Solution for Virtual Infrastructure Management in Private and Hybrid Clouds. IEEE INTERNET COMPUTING, SPECIAL ISSUE ON CLOUD COMPUTING, 2009. 109 SYMANTEC. Pesquisa sobre Situação de Cloud Computing: resultados da América Latina. Disponível em: <http://www.symantec.com/content/pt/br/enterprise/images/theme/state-ofcloud/State-of-Cloud-Report-LAM-PORT-FN.pdf>. Acesso em: 28 abr. 2012. TANENBAUM, Andrew S. Distributed Operating Systems. New Jersey: Prentice Hall, 1995. TAURION, Cezar; Cloud Computing - Computação em Nuvem: Transformando o mundo da tecnologia da Informação. Rio de Janeiro: Brasport, 2009. UBUNTU. Ubuntu Enterprise Cloud. 2012b. http://www.ubuntu.com/cloud/. Acesso em: 03/09/2011. Disponível UBUNTU. Ubuntu Server. 2012a. Disponível http://www.ubuntu.com/business/server/overview. Acesso em: 07/12/2011. em: em: VELTE, Anthony T.; VELTE, Toby J.; ELSENPETER, Robert. Cloud Computing: Computação em Nuvem - Uma abordagem prática. Rio de Janeiro: Alta Books, 2011. VIRTUALBOX, Disponível em <https://www.virtualbox.org/>. Acesso em 20 mai 2012. VMWARE. 2012c. Disponível em: <http://www.vmware.com>. Acesso em 20 mai 2012. VMWARE. ESX/ESXi. Disponível em: http://www.vmware.com/products/vsphere/esxi-and-esx/overview.html. Acesso em: 05/12/2011. VMWARE. VMware vSphere. 2012b. Disponível em: <http://www.vmware.com/br/products/datacenter-virtualization/vsphere>. Acesso em 20 mai 2012. VMware. VMware White Paper – Understanding Full Virtualization, Paravirtualization, and Hardware Assist. 2012a.Disponível em: <http://www.vmware.com/files/pdf/VMware_paravirtualization.pdf>. Acesso em 20 mai 2012. 110 XEN. Disponível em: <http://www.xen.org/>. Acesso em 20 mai 2012 111 APÊNDICE A Este apêndice irá demonstrar passo a passo como realizar a instalação dos componentes Nova e Glance do Openstack. Conforme a proposta da topologia, dois servidores serão instalados para prover o ambiente computacional da nuvem. Eles foram instalados em um ambiente multi-node, onde mais de um servidor participa de uma mesma zona, provendo um ambiente escalável. Este passo a passo foi baseado na documentação oficial do Openstack de nome OPENSTACK STARTER GUIDE, (2012), com algumas modificações realizadas pelo autor. Conforme quadro de requisitos, demonstrado anteriormente neste trabalho, será efetuado a instalação básica de dois servidores utilizando o sistema operacional Linux "Ubuntu 12.04 Precise Pangolin Server 64 Bits". Após o termino da instalação do sistema operacional, é necessário efetuar a configuração da rede do ambiente e a atualização dos pacotes do sistema operacional. Servidor cloud01 Configuração da rede e atualização de pacotes Inicialmente será realizado a configuração das interfaces de rede do servidor. É necessário abrir o arquivo de configuração das interfaces e efetuar a configuração. # nano -w /etc/network/interfaces #Interface para busca de pacotes na Internet auto eth0 iface eth0 inet dhcp # Interface Pública auto eth1 iface eth1 inet static address 192.168.56.2 netmask 255.255.255.0 network 192.168.56.0 broadcast 192.168.56.255 112 # Interface Privada auto eth2 iface eth2 inet manual up ifconfig eth2 up Efetuar a reinicialização das interfaces de rede. # /etc/init.d/networking restart Com a configuração da rede finalizada, é necessário efetuar a atualização dos pacotes do sistema. # apt-get update # apt-get upgrade Instalação dos pacotes do OpenStack Após a configuração da rede e da atualização do sistema, é necessário efetuar a instalação de pacotes do OpenStack. Neste servidor, serão instalados todos os pacotes do componente Nova para administração do ambiente da nuvem e do Glance para armazenar e registrar o catálogo de imagens de máquinas virtuais. Além disso, também serão instalados os pacotes que são requisitos para o funcionamento adequado do projeto OpenStack. A seguir, será efetuado a instalação dos pacotes necessários com a utilização do utilitário apt-get. Durante a execução deste comando, será necessária uma interação com o usuário para informar a senha de root do banco de dados que será utilizada posteriormente. A senha nesta implantação também foi definida como root. Para implantações em ambientes de produção, é indispensável que as senhas de acesso utilizadas na configuração do Openstack sejam senhas fortes. apt-get install bridge-utils ntp mysql-server python-mysqldb keystone python-keystone pythonkeystoneclient glance glance-api glance-client glance-common glance-registry python-glance nova-api nova-cert nova-compute nova-compute-kvm nova-doc nova-network nova-objectstore nova-scheduler 113 nova-volume rabbitmq-server novnc nova-consoleauth openstack-dashboard qemu lvm2 open-iscsi iscsitarget iscsitarget-dkms Servidor NTP A utilização de um servidor NTP (Network Time Protocol) é com o objetivo de garantir que todos os servidores do ambiente tenham o mesmo horário, buscando uma sincronização de troca de mensagens adequada. O servidor NTP estará configurado para efetuar a sincronização de horário utilizando um servidor externo e como redundância, a base da hora local do sistema. Editar a configuração do arquivo /etc/ntp.conf e adicionar as linhas a seguir. # nano -w /etc/ntp.conf server ntp.ubuntu.com server 127.127.1.0 fudge 127.127.1.0 stratum 10 Iniciar a execução do serviço. # /etc/init.d/ntp start Após a inicialização é necessário verificar se o horário e data estão corretos. # date Banco de Dados O sistema de banco de dados utilizado neste ambiente será o MySQL, embora outros bancos de dados possam ser utilizados. Este banco de dados será utilizado pelos componentes do Keystone, Nova e Glance do Openstack. Será necessário efetuar a instalação do banco, e a criação de usuários e bancos para os respectivos componentes. Utilizando a senha de root do banco de dados criada anteriormente, os bancos, usuários e permissões serão criados a seguir. 114 Os comandos abaixo realizarão o cadastro do banco de nome “nova”, um usuário de nome novadbadmin, definirá uma senha de acesso e irá adicionar direitos de acesso deste usuário com seu respectivo banco. Edite o arquivo do mysql-server de modo que ele ouça em todos os ips do servidor. # sed -i 's/127.0.0.1/0.0.0.0/g' /etc/mysql/my.cnf Reinicie o serviço do banco de dados. # /etc/init.d/mysql restart # mysql -uroot -proot -e 'CREATE DATABASE nova;' # mysql -uroot -proot -e 'CREATE USER novadbadmin;' # mysql -uroot -proot -e "GRANT ALL PRIVILEGES ON nova.* TO 'novadbadmin'@'%';" # mysql -uroot -proot -e "SET PASSWORD FOR 'novadbadmin'@'%' = PASSWORD('senhanova');" Os comandos abaixo realizarão o cadastro do banco de nome glance, um usuário de nome glancedbadmin, definirá uma senha de acesso e irá adicionar direitos de acesso deste usuário com seu respectivo banco. # mysql -uroot -proot -e 'CREATE DATABASE glance;' # mysql -uroot -proot -e 'CREATE USER glancedbadmin;' # mysql -uroot -proot -e "GRANT ALL PRIVILEGES ON glance.* TO 'glancedbadmin'@'%';" # mysql -uroot -proot -e "SET PASSWORD FOR 'glancedbadmin'@'%' = PASSWORD('senhaGlance');" Os comandos abaixo realizarão o cadastro do banco de nome keystone, um usuário de nome keystonedbadmin, definirá uma senha de acesso e irá adicionar direitos de acesso deste usuário com seu respectivo banco. # mysql -uroot -proot -e 'CREATE DATABASE keystone;' # mysql -uroot -proot -e 'CREATE USER keystonedbadmin;' 115 # mysql -uroot -proot -e "GRANT ALL PRIVILEGES ON keystone.* TO 'keystonedbadmin'@'%';" # mysql -uroot -proot -e "SET PASSWORD FOR 'keystonedbadmin'@'%' = PASSWORD('senhaKeystone');" Keystone Para a configuração do Keystone (instalado previamente pelo apt-get) será necessário algumas alterações no arquivo /etc/keystone/keystone.conf para posteriormente inicializar o serviço e criar as tabelas do banco de dados. Edite o arquivo de configuração do keystone e altere ou adicione as configurações conforme a seguir. # nano -w /etc/keystone/keystone.conf [DEFAULT] admin_token = admin [sql] connection = mysql://keystonedbadmin:[email protected]/keystone Reinicie o serviço do Keystone para utilizar as novas configurações. # /etc/init.d/keystone restart Instale o banco de dados do Keystone no servidor MySQL. # keystone-manage db_sync Após, exporte as variáveis a seguir para o sistema. Elas serão utilizadas para interação com o Keystone. Elas foram adicionadas no arquivo .bashrc, de modo que o usuário root do sistema sempre tenha estas variáveis definidas. # echo "###CONFIGURAÇÕES OPENSTACK" >> ~/.bashrc # echo "export SERVICE_ENDPOINT=\"http://localhost:35357/v2.0\"" >> ~/.bashrc # echo "export SERVICE_TOKEN=admin" >> ~/.bashrc 116 Após, atualize as variáveis. # source ~/.bashrc Por fim, é necessário criar os tenants, users e roles, services e endpoints do Keystone, que serão utilizados pelos demais projetos para realizarem a autenticação e autorização. Como a criação destes atributos pode gerar uma certa confusão, foi desenvolvido durante este trabalho um script para facilitar a criação dos atributos básicos para o correto funcionamento do Keystone. # nano -w /tmp/keystone_create.sh #!/bin/bash #DEFINIR IP SERVIDOR IP="192.168.56.2" REGION="unisinosVS" #CRIAR TENANTS keystone tenant-create --name admin keystone tenant-create --name service #CRIAR USERS keystone user-create --name admin --pass admin --email [email protected] keystone user-create --name nova --pass nova --email [email protected] keystone user-create --name glance --pass glance --email [email protected] keystone user-create --name swift --pass swift --email [email protected] #CRIAR ROLES keystone role-create --name admin keystone role-create --name Member #BUSCA OS IDS CRIADOS ANTERIORMENTE #TENANT TENANTID_ADMIN=`keystone tenant-list | grep admin | awk '{print $2}'` TENANTID_SERVICE=`keystone tenant-list | grep service | awk '{print $2}'` 117 #USER USERID_ADMIN=`keystone user-list | grep admin | awk '{print $2}'` USERID_NOVA=`keystone user-list | grep nova | awk '{print $2}'` USERID_GLANCE=`keystone user-list | grep glance | awk '{print $2}'` USERID_SWIFT=`keystone user-list | grep swift | awk '{print $2}'` #ROLE ROLEID_ADMIN=`keystone role-list | grep admin | awk '{print $2}'` ROLEID_MEMBER=`keystone role-list | grep Member | awk '{print $2}'` #ADICIONA POLÍTICAS PARA O ADMIN keystone user-role-add --user $USERID_ADMIN --role $ROLEID_ADMIN --tenant_id $TENANTID_ADMIN #ADICIONA POLÍTICAS PARA OS RESPECTIVOS USUÁRIOS keystone user-role-add --user $USERID_NOVA --role $ROLEID_ADMIN --tenant_id $TENANTID_SERVICE keystone user-role-add --user $USERID_GLANCE --role $ROLEID_ADMIN --tenant_id $TENANTID_SERVICE keystone user-role-add --user $USERID_SWIFT --role $ROLEID_ADMIN --tenant_id $TENANTID_SERVICE #ADICIONA POLITICA PARA O MEMBRO ADMIN UTILIZADO PELO HORIZON E SWIFT keystone user-role-add --user $USERID_ADMIN --role $ROLEID_MEMBER --tenant_id $TENANTID_ADMIN #CRIAÇÃO DOS SERVIÇOS DE TODOS OS COMPONENTES DO OPENSTACK keystone service-create --name nova --type compute --description 'OpenStack Compute Service' keystone service-create --name volume --type volume --description 'OpenStack Volume Service' keystone service-create --name glance --type image --description 'OpenStack Image Service' keystone service-create --name swift --type object-store --description 'OpenStack Storage Service' keystone service-create --name keystone --type identity --description 'OpenStack Identity Service' keystone service-create --name ec2 --type ec2 --description 'EC2 Service' SERVICEID_NOVA=`keystone service-list | grep nova | awk '{print $2}'` SERVICEID_EC2=`keystone service-list | grep ec2 | awk '{print $2}'` 118 SERVICEID_KEYSTONE=`keystone service-list | grep keystone | awk '{print $2}'` SERVICEID_SWIFT=`keystone service-list | grep swift | awk '{print $2}'` SERVICEID_VOLUME=`keystone service-list | grep volume | awk '{print $2}'` SERVICEID_GLANCE=`keystone service-list | grep glance | awk '{print $2}'` keystone endpoint-create --region $REGION --service_id $SERVICEID_NOVA --publicurl 'http://'$IP':8774/v2/$(tenant_id)s' --adminurl 'http://'$IP':8774/v2/$(tenant_id)s' --internalurl 'http://'$IP':8774/v2/$(tenant_id)s' keystone endpoint-create --region $REGION --service_id $SERVICEID_VOLUME --publicurl 'http://'$IP':8776/v1/$(tenant_id)s' --adminurl 'http://'$IP':8776/v1/$(tenant_id)s' --internalurl 'http://'$IP':8776/v1/$(tenant_id)s' keystone endpoint-create --region $REGION --service_id $SERVICEID_GLANCE --publicurl 'http://'$IP':9292/v1' --adminurl 'http://'$IP':9292/v1' --internalurl 'http://'$IP':9292/v1' keystone endpoint-create --region $REGION --service_id $SERVICEID_SWIFT --publicurl 'http://'$IP':8080/v1/AUTH_$(tenant_id)s' --adminurl 'http://'$IP':8080/v1' --internalurl 'http://'$IP':8080/v1/AUTH_$(tenant_id)s' keystone endpoint-create --region $REGION --service_id $SERVICEID_KEYSTONE -publicurl http://$IP:5000/v2.0 --adminurl http://$IP:35357/v2.0 --internalurl http://$IP:5000/v2.0 keystone endpoint-create --region $REGION --service_id $SERVICEID_EC2 --publicurl http://$IP:8773/services/Cloud --adminurl http://$IP:8773/services/Admin --internalurl http://$IP:8773/services/Cloud Após a criação do arquivo, é necessário executá-lo. bash /tmp/tmp/keystone_create.sh Verifique se os endpoints foram criados corretamente. É provável que se uma lista de seis atributos for apresentada, o processo foi concluído com sucesso. # keystone endpoint-list Configuração do Glance Para a configuração do Glance (instalado previamente pelo apt-get) será necessário algumas alterações nos arquivos de configuração para posteriormente inicializar o serviço e criar as tabelas do banco de dados. 119 Abra o arquivo /etc/glance/glance-api-paste.ini e edite as configurações abaixo no final do arquivo. # nano -w /etc/glance/glance-api-paste.ini admin_tenant_name = service admin_user = glance admin_password = glance Faça as mesmas alterações no final do arquivo /etc/glance/glance-registrypaste.ini. # nano -w /etc/glance/glance-registry-paste.ini. admin_tenant_name = service admin_user = glance admin_password = glance No arquivo /etc/glance/glance-registry.conf é necessário efetuar a configuração para definição do banco de dados e também é preciso configurar o Glance para que utilize a autenticação integrada com o Keystone. # nano -w /etc/glance/glance-registry.conf sql_connection = mysql://glancedbadmin:[email protected]/glance [paste_deploy] flavor = keystone Faça as mesmas alterações no arquivo /etc/glance/glance-api.conf para utilização do serviço de autenticação do Keystone. # nano -w /etc/glance/glance-api.conf [paste_deploy] flavor = keystone 120 Após a configuração dos arquivos do Glance, é necessário criar as tabelas do banco de dados. # glance-manage version_control 0 # glance-manage db_sync Por fim, os serviços precisam ser reinicializados. # /etc/init.d/glance-api restart # /etc/init.d/glance-registry restart Adicione as variáveis de autenticação do Glance para o arquivo .bashrc do usuário root. Assim com o Keystone, estas configurações serão realizadas para manter permanentemente as variáveis definidas. # echo "export SERVICE_TOKEN=admin" >> ~/.bashrc # echo "export OS_TENANT_NAME=admin" >> ~/.bashrc # echo "export OS_USERNAME=admin" >> ~/.bashrc # echo "export OS_PASSWORD=admin" >> ~/.bashrc # echo "export OS_AUTH_URL=\"http://localhost:5000/v2.0/\"" >> ~/.bashrc # echo "export SERVICE_ENDPOINT=http://localhost:35357/v2.0" >> ~/.bashrc Após, leia as variáveis. # source ~/.bashrc Verifique ser o serviço está funcionando adequadamente. O retorno padrão do comando a seguir será 0, ou seja, este é o valor de retorno para o bash, quando corresponde a um retorno de sucesso. Na tela, nada será exibido. # glance index 121 Instalação dos Componentes do Nova Para a configuração do Nova (instalado previamente pelo apt-get) será necessário algumas alterações nos arquivos de configuração para posteriormente inicializar o serviço e criar as tabelas do banco de dados. O Nova e todos os seus componentes utilizam basicamente um arquivo principal de configuração chamado nova.conf e alguns outros com configurações auxiliares. Para facilitar seu entendimento, a configuração do arquivo foi separada em pequenas divisões conforme cada respectivo componente. Editar o arquivo /etc/nova/nova.conf e configurá-lo conforme abaixo. # nano -w /etc/nova/nova.conf # GERAL --daemonize=1 --dhcpbridge=/usr/bin/nova-dhcpbridge --logdir=/var/log/nova --state_path=/var/lib/nova --verbose --libvirt_use_virtio_for_bridges --FAKE_subdomain=ec2 --state_path=/var/lib/nova --lock_path=/var/lock/nova --root_helper=sudo nova-rootwrap --zone_name=unisinosVS --node_availability_zone=unisinosVS --storage_availability_zone=unisinosVS --auth_strategy=keystone --enable_zone_routing --ajax_console_proxy_url=http://192.168.56.2:8000 --osapi_host=192.168.56.2 # NOVA-NETWORK --dhcpbridge_flagfile=/etc/nova/nova.conf 122 --force_dhcp_release --fixed_range=10.1.0.0/16 --network_size=32 --num_networks=1 --public_interface=eth1 --auto_assign_floating_ip --vlan_start=100 --vlan_interface=eth2 # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) --routing_source_ip=192.168.56.2 # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) --my_ip=192.168.56.2 --send_arp_for_ha --network_manager=nova.network.manager.FlatDHCPManager # NOVA-COMPUTE --connection_type=libvirt --libvirt_type=qemu --multi_host --iscsi_ip_prefix=192.168. --iscsi_ip_address=192.168.56.2 --api_paste_config=/etc/nova/api-paste.ini --image_service=nova.image.glance.GlanceImageService --glance_api_servers=192.168.56.2:9292 # BANCO DE DADOS --sql_connection=mysql://novadbadmin:[email protected]/nova # RABBITMQ --rabbit_host=192.168.56.2 # NOVA-API --ec2_host=192.168.56.2 --ec2_dmz_host=192.168.56.2 --ec2_url=http://192.168.56.2:8773/services/Cloud --s3_host=192.168.56.2 --s3_dmz=192.168.56.2 --keystone_ec2_url=http://192.168.56.2:5000/v2.0/ec2tokens --allow_admin_api 123 # NO-VNC CONSOLE --novnc_enabled=true --novncproxy_base_url=http://192.168.56.2:6080/vnc_auto.html # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) --vncserver_proxyclient_address=192.168.56.2 # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) --vncserver_listen=192.168.56.2 --vncserver_host=0.0.0.0 # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) --vncproxy_url=http://192.168.56.2:6080 # NOVA-SCHEDULER --scheduler_driver=nova.scheduler.simple.SimpleScheduler # NOVA-VOLUMES --volume_group=nova-volumes Altere as configurações de dono e permissões da pasta /etc/nova e do arquivo /etc/nova/nova.conf. # chown -R nova:nova /etc/nova # chmod 644 /etc/nova/nova.conf Adicione ao final do arquivo /etc/nova/api-paste.ini as configurações de tenant do Nova. # nano -w /etc/nova/api-paste.ini admin_tenant_name = service admin_user = nova admin_password = nova Crie as tabelas do Nova no banco de dados. # nova-manage db sync 124 Após, exporte as variáveis a seguir para o sistema. Elas serão utilizadas para a interação com o Nova. Elas foram adicionadas no arquivo .bashrc, de modo que o usuário root do sistema sempre tenha estas variáveis definidas. # echo "export OS_TENANT_NAME=admin" >> ~/.bashrc # echo "export OS_USERNAME=admin" >> ~/.bashrc # echo "export OS_PASSWORD=admin" >> ~/.bashrc # echo "export OS_AUTH_URL=\"http://localhost:5000/v2.0/\"" >> ~/.bashrc É necessário criar uma rede privada que será destinada para as instâncias que serão iniciadas. O nova-network será responsável por alocar por DHCP os endereços privados para as respectivas máquinas. O comando abaixo irá criar um grupo de ips, disponibilizando 32 endereços privados utilizando uma interface bridge de nome br100 respectiva a uma VLAN de vinculada a interface eth2. # nova-manage network create private --fixed_range_v4=10.1.0.0/27 --num_networks=1 -bridge=br100 --bridge_interface=eth2 --network_size=32 Agora será criado um grupo de ips flutuantes e que será atribuido para as instâncias como forma de comunicação com a rede pública (internet). Aqui é importante uma observação. Como a rede de administração do ambiente do OpenStack é a mesma da rede pública, deve-se tomar o cuidado para não atribuir uma lista de ips correspondente aos ips dos serviços, o que ocasionaria um conflito de ips e a falta de comunicação entre os nodes. O comando abaixo irá criar um total de 32 ips que será destinado para as instâncias a partir do endereço 192.168.56.64/27. nova-manage floating create --ip_range=192.168.56.64/27 --interface eth1 Após, atualize as variáveis. # source ~/.bashrc 125 Instalação do Nova-Volumes Para disponibilizar um volume com dados permanentes para as instâncias, é necessário efetuar a configuração do nova-volume. Primeiramente, é necessário disponibilizar uma LVM para o servidor cloud01 que estiver com o serviço do novavolume ativo. Este VG (Volume Group) terá o nome de nova-volumes conforme configuração estabelecida no arquivo nova.conf (--volume_group=nova-volumes). Com o volume criado, o nova-volume poderá criar vários LV (Logical Volume) com diferentes tamanhos e que serão vinculados a instâncias já existentes. Primeiramente é necessário ter um disco dedicado e criar uma partição do tipo LVM (código 8e do fdisk), após o volume pode ser criado e o serviço iscsitarget (utilizado para prover o acesso aos volumes lógicos) pode ser iniciado. Criar a partição do tipo LVM (tipo 8e) com o fdisk no disco /dev/sdb disponibilizado para o nova-volumes. # fdisk /dev/sdb A seguir é criado o volume na partição /dev/sdb1 # pvcreate /dev/sdb1 # vgcreate nova-volumes /dev/sdb1 Agora, é necessário efetuar a configuração do serviço ISCSI. Conforme estabelecido anteriormente, este nó irá realizar tarefas do nova controller, além do nova-compute, iniciando instâncias. Por esta razão, este nó irá prover não somente o serviço de iscsi como também será um cliente dele próprio. A seguir, é habilitado o serviço ISCSI no arquivo /etc/default/iscsitarget. # sed -i 's/false/true/g' /etc/default/iscsitarget Reinicie os serviços iscsitarget (prover serviço iscsi), o open-iscsi (cliente iscsi) e o nova-volume. 126 # /etc/init.d/iscsitarget restart # /etc/init.d/open-iscsi restart # /etc/init.d/nova-volume restart Após todas as configurações realizadas, reinicialize todos os servidos do Openstack Nova. # sudo restart libvirt-bin; sudo restart nova-network; sudo restart nova-compute; sudo restart nova-api; sudo restart nova-objectstore; sudo restart nova-scheduler; sudo restart nova-volume; sudo restart nova-consoleauth; Por fim, verifique se todos os serviços estão ativos. # nova-manage service list Binary Host Zone Status State Updated_At nova-scheduler cloud01 unisinosVS enabled :-) 2012-05-10 20:51:51 nova-compute unisinosVS enabled :-) 2012-05-10 20:51:42 nova-cert cloud01 cloud01 nova-consoleauth cloud01 unisinosVS unisinosVS enabled :-) 2012-05-10 20:52:28 enabled :-) 2012-05-10 20:51:52 nova-volume cloud01 unisinosVS enabled :-) 2012-05-10 20:51:52 nova-network cloud01 unisinosVS enabled :-) 2012-05-10 20:51:54 Configuração do Horizon Dashboard Se tudo estiver funcionando corretamente, o dashboard já estará pronto para ser utilizado. Ele foi instalado pelo comando apt-get anteriormente. Através de um navegador, é possível acessar a interface web pelo endereço http://192.168.56.2/. O próximo passo é a instalação do segundo servidor. Para ser possível a sua posterior identificação, é necessário configurar o nome do segundo nó do qual será chamado de cloud02. # echo "192.168.56.3 cloud02" >> /etc/hosts 127 Servidor cloud02 Configuração da Rede e atualização de pacotes Assim como no servidor cloud01, incialmente será realizado a configuração das interfaces de rede do servidor. Configure as interfaces de rede. # nano -w /etc/network/interfaces #Interface para busca de pacotes na Internet auto eth0 iface eth0 inet dhcp # Interface Pública auto eth1 iface eth1 inet static address 192.168.56.3 netmask 255.255.255.0 network 192.168.56.0 broadcast 192.168.56.255 # Interface Privada auto eth2 iface eth2 inet manual up ifconfig eth2 up Efetuar a reinicialização das interfaces de rede. # /etc/init.d/networking restart Com a configuração da rede finalizada, é necessário efetuar a atualização dos pacotes do sistema. # apt-get update # apt-get upgrade 128 Instalação dos pacotes do OpenStack Após a configuração da rede e da atualização do sistema, é necessário efetuar a instalação de pacotes do OpenStack. Neste servidor, serão instalados apenas os pacotes do nova-compute e nova-network, já que ele irá apenas instanciar máquinas virtuais. Ainda assim, alguns pacotes que são requisitos para o funcionamento adequado do projeto OpenStack serão também instalados como o cliente iscsi, o cliente ntp e o emulador Qemu. # apt-get install bridge-utils ntp nova-compute nova-network qemu open-iscsi Instalação do Servidor NTP Agora é necessário sincronizar o horário com o servidor cloud01 de modo que ambos tenham o mesmo horário. Editar a configuração do arquivo /etc/ntp.conf e adicionar a linha a seguir. # nano -w /etc/ntp.conf server 192.168.56.2 Iniciar a execução do serviço. # /etc/init.d/ntp start Após a inicialização, é necessário verificar se o horário e data estão corretos e sincronizados com o servidor cloud01. # date Agora é necessário adicionar o nome do host do primeiro servidor na lista de hosts. Isso é necessário para que seja possível a identificação de ambos no gerenciamento do ambiente. 129 # echo "192.168.56.2 cloud01" >> /etc/hosts Editar o arquivo /etc/nova/nova.conf e configurá-lo conforme abaixo. Ele é uma cópia do host cloud01, com pequenas modificações em alguns dos endereços ips, conforme abaixo. # nano -w /etc/nova/nova.conf # GERAL --daemonize=1 --dhcpbridge=/usr/bin/nova-dhcpbridge --logdir=/var/log/nova --state_path=/var/lib/nova --verbose --libvirt_use_virtio_for_bridges --FAKE_subdomain=ec2 --state_path=/var/lib/nova --lock_path=/var/lock/nova --root_helper=sudo nova-rootwrap --zone_name=unisinosVS --node_availability_zone=unisinosVS --storage_availability_zone=unisinosVS --auth_strategy=keystone --enable_zone_routing --ajax_console_proxy_url=http://192.168.56.2:8000 --osapi_host=192.168.56.2 # NOVA-NETWORK --dhcpbridge_flagfile=/etc/nova/nova.conf --force_dhcp_release --fixed_range=10.1.0.0/16 --network_size=32 --num_networks=1 --public_interface=eth1 --auto_assign_floating_ip --vlan_start=100 --vlan_interface=eth2 # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) 130 --routing_source_ip=192.168.56.3 # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) --my_ip=192.168.56.3 --send_arp_for_ha --network_manager=nova.network.manager.FlatDHCPManager # NOVA-COMPUTE --connection_type=libvirt --libvirt_type=qemu --multi_host --iscsi_ip_prefix=192.168. --iscsi_ip_address=192.168.56.2 --api_paste_config=/etc/nova/api-paste.ini --image_service=nova.image.glance.GlanceImageService --glance_api_servers=192.168.56.2:9292 # BANCO DE DADOS --sql_connection=mysql://novadbadmin:[email protected]/nova # RABBITMQ --rabbit_host=192.168.56.2 # NOVA-API --ec2_host=192.168.56.2 --ec2_dmz_host=192.168.56.2 --ec2_url=http://192.168.56.2:8773/services/Cloud --s3_host=192.168.56.2 --s3_dmz=192.168.56.2 --keystone_ec2_url=http://192.168.56.2:5000/v2.0/ec2tokens --allow_admin_api # NO-VNC CONSOLE --novnc_enabled=true --novncproxy_base_url=http://192.168.56.2:6080/vnc_auto.html # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) --vncserver_proxyclient_address=192.168.56.3 # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) --vncserver_listen=192.168.56.3 --vncserver_host=0.0.0.0 # ABAIXO (PRECISA SER DIFERENTE PARA CADA NÓ) 131 --vncproxy_url=http://192.168.56.3:6080 # NOVA-SCHEDULER --scheduler_driver=nova.scheduler.simple.SimpleScheduler # NOVA-VOLUMES --volume_group=nova-volumes Reinicialize os serviços do nova-compute e nova-network. Neste momento este nó irá se integrar a zona de nome unisinosVS, juntamente com o nó cloud01. # /etc/init.d/nova-compute restart # /etc/init.d/nova-network restart Por fim, verifique se os componentes de todos os nós estão ativos. Quando o “State” estiver como “:-)" significa que o serviço está operante. Quando estiver como "XXX" significa que está fora do ar, e não pode ser consultado. # nova-manage service list Binary Host nova-cert cloud01 nova-consoleauth cloud01 nova-console nova-compute cloud01 Zone Status unisinosVS unisinosVS unisinosVS State Updated_At enabled :-) 2012-05-10 22:03:29 enabled enabled :-) 2012-05-10 22:03:23 :-) 2012-05-10 22:03:21 cloud01 unisinosVS enabled :-) 2012-05-10 22:03:24 nova-scheduler cloud01 unisinosVS enabled :-) 2012-05-10 22:03:24 nova-network cloud01 unisinosVS enabled :-) 2012-05-10 22:03:25 nova-volume cloud01 unisinosVS enabled :-) 2012-05-10 22:03:22 nova-compute nova-network cloud02 cloud02 unisinosVS unisinosVS enabled enabled :-) 2012-05-10 22:03:22 :-) 2012-05-10 22:03:25 Envio de imagens Com o ambiente totalmente instalado, é necessário enviar uma imagem de um sistema operacional, e que será utilizado posteriormente para iniciar uma nova instância. Para isso, os comandos do Glance, serão executados diretamente no terminal do servidor cloud01. Em função disto, é necessário baixar uma imagem do Ubuntu e que já está preparada para integrar-se com o ambiente do Openstack. 132 Após o download estar concluído, a imagem pode ser descompactada e enviada para o Glance. # wget http://uec-images.ubuntu.com/releases/precise/release/ubuntu-12.04-server-cloudimgamd64.tar.gz # tar –zxvf ubuntu-12.04-server-cloudimg-amd64.tar.gz Enviar a imagem de kernel AKI para o Glance. Essa imagem é responsável por iniciar o sistema pela primeira vez. #glance add name="precise-server-cloudimg-amd64-vmlinuz-virtual" is_public=true disk_format=aki container_format=aki architecture=x86_64 < precise-server-cloudimg-amd64-vmlinuzvirtual Verificar o identificador ID da imagem enviada com o comando “nova imagelist”. # nova image-list Utilizando o identificador ID da imagem acima, enviar a imagem completa do sistema. Esta imagem é o sistema operacional instalado e pronto para ser utilizado. #glance add name="ubuntu-server-cloudimg-amd64-12.04" is_public=true disk_format=ami container_format=ami architecture=x86_64 kernel_id=7538d245-b991-4d5f-822f-c3b9694c9fc8 < precise-server-cloudimg-amd64.img Grupo de Segurança Antes de iniciar a máquina virtual, é necessário criar um grupo de segurança no OpenStack. Este grupo é responsável por liberar e encaminhar as solicitações dos protocolos TCP (Transmission Control Protocol), UDP (User Datagram Protocol) e ICMP (Internet Control Message Protocol). Será liberada a porta 22, onde será possível acessar remotamente por SSH (Secure Shell) e o protocolo ICMP (Internet Control Message Protocol), para que sejam possíveis testes de conectividade. O comando a seguir irá criar um grupo de nome “unisinos” e irá atribuir a este grupo, a porta 22 e o protocolo ICMP com as “flags” “-1” e “-1”. 133 # nova secgroup-create unisinos "unisinos" # nova secgroup-add-rule unisinos tcp 22 22 0.0.0.0/0 # nova secgroup-add-rule unisinos icmp -1 -1 0.0.0.0/0 Criação de um par de chaves pública / privada Para iniciar a instância, é necessário primeiramente criar um par de chaves públicas / privadas, utilizado para iniciar a instância e posteriormente para acessar a instância pelo protoloco SSH. O comando chmod abaixo é utilizado para proteger o acesso à chave de usuários não autorizados. # nova keypair-add unisinos > unisinos.pem # chmod 600 test.pem Execução de uma instância Após a criação do grupo a instância poderá ser iniciada. Uma instância de nome “unisinos_vm01”, utilizando a imagem enviada anteriormente, será executada. É importante observar que a imagem será iniciada usando como referência uma máquina do tipo “m1.tiny”, utilizando o grupo de segurança criado anteriormente, de nome “unisinos” e um par de chaves de nome “unisinos”. # nova boot --image " ubuntu-server-cloudimg-amd64-12.04" --flavor m1.tiny --key_name unisinos --security_groups unisinos unisinos_vm01 Por fim, utilizando o comando “nova list”, é possível verificar informações das instâncias que estão sendo executadas nesta zona. # nova list +--------------------------------------+---------------+--------+-------------------------------+ | ID | Name | Status | Networks | +--------------------------------------+---------------+--------+-------------------------------+ | ec35e0eb-dc9e-4dac-a3f4-f596275012f9 | unisinos_vm01 | ACTIVE | vmnet=10.1.0.3, 192.168.56.67 | +--------------------------------------+---------------+--------+-------------------------------+ Criação de um novo volume de dados 134 Conforme relatado anteriormente, o volume de dados é fornecido pelo novavolume através de um serviço iscsi. O comando a seguir cria um novo volume de nome unisinos01 e com 1GB de espaço # nova volume-create --display_name unisinos01 1 Após o volume ser criado, é necessário vincular ele a uma instância em execução. O próximo passo é a inclusão do volume na instância executada anteriormente. Após, o volume pode ser acessado na instância virtual como um novo dispositivo de nome “/dev/vdb” # nova volume-attach ec35e0eb-dc9e-4dac-a3f4-f596275012f9 1 /dev/vdb Existe uma falha no OpenStack que por vezes não consegue disponibilizar um volume para um instância, pois não realiza o logon no serviço iscsi. Se um erro ocorrer, e não for possível vincular o volume, o comando a seguir efetua o login no iscsi e disponibiliza para que o nova-compute faça a busca pelo dispositivo fornecendo o volume para a instância. # iscsiadm -m node -T iqn.2010-10.org.openstack:volume-00000007 -p 192.168.56.2:3260 -login Acessar e logar na máquina virtual Para acessar a instância criada, é necessário informar a chave pública criada anteriormente, utilizando-a para conectar-se na máquina pelo protocolo SSH. # ssh -i unisinos.pem [email protected]