MONITORAMENTO DISTRIBUÍDO DE CLUSTERS E GRIDS COMPUTACIONAIS UTILIZANDO O GANGLIA Redes de Computadores e Sistemas Distribuídos José Luís Zem e Samuel Henrique Bucke Brito Universidade Metodista de Piracicaba - UNIMEP {jlzem,shbrito}@unimep.br Cluster de Computadores Arquitetura de um Cluster de Computadores Cluster de Alta Disponibilidade (HA) O Ambiente de Cluster de Computadores Monitorado pelo Ganglia Funções desempenhadas pelos nós Cluster de Alto Desempenho (HPC) Cluster de Balanceamento de Carga (HS) Configuração do Cluster Construído Serviços Instalados no Monitor monitor.example.org [ Linux Fedora 4 – Kernel 2.6.11 ] Cgi gateway [ Viabiliza a comunicação entre o sistema operacional e a web ] nodo1.example.org [ Linux Slax Live – Kernel 2.4.28 ] Daemon gmond [ Faz o monitoramento local do nó monitor do cluster ] nodo2.example.org [ Linux Slax Live – Kernel 2.4.28 ] Daemon gmetad [ Faz a solicitação dos dados monitorados aos daemons gmond ] nodo3.example.org [ Linux Slax Live – Kernel 2.4.28 ] RRDTool [ Armazenar os dados em memória e gerar os gráficos ] nodo4.example.org [ Linux Slax Live – Kernel 2.4.28 ] Servidor http com php [ Responsável pelo servidor apache, com suporte ao php ] Resultado dos Testes Realizados Clusters de Computadores podem ser definidos como sendo um conjunto composto por dois ou mais computadores interconcectados através de alguma tecnologia de rede de comunicação e trabalhando em conjunto para fins comuns. Grade Computacional / Grid Computing Visão geral do Monitoramento do Cluster Grade (grid) Computacional Identificação dos Nós componentes do Cluster Visão do Usuário de uma Grade (grid) Computacional Arquitetura de uma Grade Computacional Um ambiente de Grade (Grid) Computacional pode ser visto como um computador virtual, composto dinamicamente por recursos geograficamente distribuídos e interconectados através de enlaces de alta velocidade. Ganglia – Sistema de Monitoramento Distribuído Monitoramento do Nó02 Algumas Métricas do Nó02 Arquitetura do Ganglia Front-End do Ganglia Interrupção do Nó02 É um software open-source e que teve sua origem na Universidade da Califórinia (Berkeley) Reativação do Nó02 O Ganglia é um sistema de monitoramento distribuído desenvolvido para ser executado em ambientes de computação de alto desempenho, nos quais se enquadram os Clusters de Computadores e Grades (Grids) Computacionais. Utiliza-se de diversas tecnologias como XML, XDR, RRDtool entre outras. Monitoramento de vários Clusters O cluster foi colocado em funcionamento, juntamente com o monitorador Ganglia. Em seguida verificou-se que todos os nós estavam operacionais. Deativou-se o Nó02 e voltou-se a observar o monitorador do Cluster. A ausência do NÓ02 foi detectada. Ao se reativar o NÓ02, o monitorador automaticamente detectou a presença do NÓ, inserindo-o novamente no sistema.