Laboratórios do Mundo Uni-vos!!!
Francisco Brasileiro
[email protected]
Universidade Federal de Campina Grande, Brasil
Centro de Engenharia Elétrica e Informática
Departamento de Sistemas e Computação
Laboratório de Sistemas Distribuídos
http://www.lsd.ufcg.edu.br/
Seminários da Física
1/27
Campina Grande, 9 de junho de 2009
Roteiro
•
•
•
•
E-Ciência
Grades computacionais
Grades entre-pares (peer-to-peer)
O OurGrid
– Arquitetura
– Uso
• A GridUFCG
Seminários da Física
2/27
Campina Grande, 9 de junho de 2009
e-Ciência
• A tecnologia da informação está mudando a
forma de se fazer pesquisa científica
– Viabilizando a colaboração
– Atuando como importante ferramenta na
investigação
• Análise de dados (ex. mineração de dados)
• Geração de dados (ex. simulação)
• Como resultado, muitos laboratórios de
pesquisa, pelo mundo a fora, têm aumentado
a demanda por poder computacional
Seminários da Física
3/27
Campina Grande, 9 de junho de 2009
Grades Computacionais
• Grades computacionais oferecem
mecanismos para o compartilhamento de
recursos, permitindo:
– Acesso a dados de terceiros
– Acesso a equipamentos sofisticados
– Aumentar o acesso a recursos
computacionais
Seminários da Física
4/27
Campina Grande, 9 de junho de 2009
O Modelo da Organização Virtual
• É o modelo de grades mais difundido
• A entrada na grade é negociada (normalmente
por humanos)
– Segurança é tratada usando os mecanismos
convencionais de Autenticação/Autorização/Auditoria
– Tem capacidade de crescimento limitada
• Permite a definição de políticas de uso flexíveis
e poderosas
– middleware complexo (Globus, gLite, etc)
– Requer um time de suporte competente
Seminários da Física
5/27
Campina Grande, 9 de junho de 2009
Computação Voluntária
• Se apóia na existência de uma enorme quantidade de
poder computacional ocioso nas “pontas” da Internet
– SETI@home (Berkley), Folding@home (Stanford)
• Se mostraram capazes de capturar uma quantidade
significativa de poder computacional
– Grade aberta do ponto de vista dos provedores
– Instalação fácil do software do provedor
• Barreira de entrada é ainda maior, pois requer:
–
–
–
–
Projetos com alta visibilidade
Grande esforço de marketing
Provedor de aplicações com prestígio
Time de suporte qualificado para gerenciar o “servidor”
Seminários da Física
6/27
Campina Grande, 9 de junho de 2009
Esses modelos servem para
resolver o problema do aumento da
demanda computacional de boa
parte dos laboratórios do mundo?
Seminários da Física
7/27
Campina Grande, 9 de junho de 2009
Esses laboratórios ...
• São pequenos
• Direcionam a sua pesquisa para
um tópico específico
• Não pertencem às mais
importantes universidades do
mundo
• Não contam com um time de
suporte super especializado
Seminários da Física
8/27
Campina Grande, 9 de junho de 2009
Grades entre-pares (peer-to-peer)
• Cada laboratório corresponde a um peer no
sistema e contribui com seus recursos ociosos
Utilização da CPU pelo lab 1
1
tempo
Utilização da cpu pelo lab2
1
tempo
Utilização da CPU pelo grid p2p
1
tempo
Seminários da Física
9/27
Campina Grande, 9 de junho de 2009
Grades Entre-Pares
• Peers juntam-se à grade por vontade própria
– Sem burocracia
– Sem uma autoridade central
• Grade aberta para provedores e consumidores de recursos
• Custos de implantação e manutenção são
compartilhados
• Middleware potencialmente mais simples
• Isso torna a solução acessível para a maior
parte dos usuários
Seminários da Física
10/27
Campina Grande, 9 de junho de 2009
Grades Entre-Pares
• Mas ...
– O fato de não termos confiança entre os
pares trás implicações em relação à
segurança da grade
• Proteção contra aplicações não confiáveis
• Proteção contra recursos não confiáveis
– Políticas de uso mais simples
– Possibilidade de pares “caloteiros” (free
riders)
Seminários da Física
11/27
Campina Grande, 9 de junho de 2009
O OurGrid
• Middleware para dar suporte a grades
computacionais entre-pares
• Desenvolvido pela UFCG (LSD/DSC) com
financiamento da HP Brasil P&D (lei de
Informática)
• Atualmente usado em várias grades
computacionais em produção
• Será o middleware usado na GridUFCG
Seminários da Física
12/27
Campina Grande, 9 de junho de 2009
Princípios de design do OurGrid
• Os laboratórios podem, gratuitamente, juntar-se ao sistema
sem negociação humana
– Não há necessidade de reunião e papelada a ser preenchida
• Incentivo claro para juntar-se ao sistema
– Ninguém se prejudica ao juntar-se ao sistema
– Resistente a free riders
• Propriedades básicas
– Oferece um nível mínimo de segurança
– É tolerante a falhas
– Escalável
• Fácil de instalar, configurar e programar
– Não há necessidade de um corpo técnico de suporte muito especializado
Seminários da Física
13/27
Campina Grande, 9 de junho de 2009
Mas … tudo tem seu preço!
• Para simplificar os problemas, nós nos focamos
em aplicações Bag-of-Tasks (BoT)
– Aplicações que são constituídas por um grande
número de tarefas independentes que podem ser
executadas em paralelo
• Felizmente, muitas aplicações importantes são
BoT!
– Data mining, Bio-informática, Simulações Monte
Carlo, Cálculo de fractais, Processamento de
imagens e muitas outras …
Seminários da Física
14/27
Campina Grande, 9 de junho de 2009
Arquitetura do OurGrid
Interface do Usuário
Escalonamento de Aplicações
Serviço de
Rendezvous
Segurança
Seminários da Física
Gerência do site
Compartilhamento de Recursos
15/27
Campina Grande, 9 de junho de 2009
Habilitando uma aplicação para
executar na Grade
• Escrevendo um script usando uma linguagem
bem simples
– Abstrações simples
• Transferência de arquivos (put, store, get)
• Esconde a heterogeneidade da plataforma
($PLAYPEN, $STORAGE)
• Definição de requisitos da aplicação e de atributos dos
recursos
• Implantando um Portal que serve de interface
para a aplicação
• Escrevendo um programa que faz chamadas à
API Java do middleware
Seminários da Física
16/27
Campina Grande, 9 de junho de 2009
Um exemplo:
Rendering usando o OurGrid
job:
label: my_rendering_example
requirements: (os=linux)
task:
init:
store render render
put frame1 frame1
remote:
$STORAGE/render < frame1 > output-$JOB-$TASK
final:
get output-$JOB-$TASK output-frame1
task:
init:
store render render
put frame2 frame2
remote:
$STORAGE/render < frame2 > output-$JOB-$TASK
final:
get output-$JOB-$TASK output-frame2
…
Seminários da Física
17/27
Campina Grande, 9 de junho de 2009
Algumas Aplicações
• Baseadas em scripts
– Avaliação de risco de empréstimos agrícolas
(EMBRAPA)
– Nossa própria pesquisa em ciência da
computação
• Simulações
• Baseadas na API
– SmartPumping (PETROBRAS)
• Execução paralela de algorítmos genéticos para otimização
do bombeio de petróleo
– EPANET-Grid (projeto de P&D)
• Versão do EPANET habilitada para execução em grade
– GridVida (projeto de P&D)
• Processamento de imagens em repositórios digitais para dar
suporte ao diagnóstico
Seminários da Física
18/27
Campina Grande, 9 de junho de 2009
Algumas Aplicações
• Baseados em Portais
– SegHidro (projeto de P&D)
• “Ecossistema” de gestão de recursos hídricos
• Usuários na academia, no governo e na indústria
– Pesquisadores desenvolvendo novos modelos e ajustando
modelos existentes
– Centros operacionais provendo informação à sociedade gerada
a partir de simulações ou de medições
• Permite a configuração de workflows de modelos de
simulação e a execução dos mesmos em ensembles
• Permite o compartilhamento de recursos
computacionais, dados e expertise complementar
Seminários da Física
19/27
Campina Grande, 9 de junho de 2009
Estado Atual do OurGrid
• OurGrid dá suporte à comunidade OurGrid
– Uma grade de entrada aberta que está em produção desde
dezembro de 2004
– http://status.ourgrid.org/
• ShareGrid
– Projeto colaborativo coordenado pelo TOPIX (TOrino Piemonte
Internet eXchange) na Itália
– http://dcs.di.unipmn.it/
• EELA-2
– Projeto financiado pela CE que visa a implantação de uma
grade computacional envolvendo várias instituições na América
Latina e na Europa
• Nosso papel nesse projeto é fazer o OurGrid interoperar com o
gLite (middleware usado pela grade do CERN)
• O OurGrid é distribuído como open source (GPL) e a versão
4.1.5 está disponível em http://www.ourgrid.org/
– Contribuições são muito bem-vindas!
Seminários da Física
20/27
Campina Grande, 9 de junho de 2009
A GridUFCG
• Projeto submetido ao CT-INFRA 2009
• Grade computacional institucional que permitirá
o compartilhamento de boa parte da infraestrutura de TI da UFCG
– Na primeira fase de implantação
• 1.500 desktops de uso compartilhado (laboratórios de ensino
e pesquisa e administração)
• 7 clusters
• Licenças de software
• Dados
• Inclui o treinamento de alunos e pesquisadores
em metodologias científicas apoiadas no uso de
TI
Seminários da Física
21/27
Campina Grande, 9 de junho de 2009
Conclusões
• Nós desenvolvemos o software necessário para manter
uma grade computacional entre-pares aberta para dar
suporte a aplicações BoT que está ajudando pessoas
com a realizarem suas pesquisas de forma mais rápida
e efetiva
• Nosso próximo passo é massificar o uso da
tecnologia
– GridUFCG é um dos principais vetores dessa
massificação no nível local
• Usuários reais são primordiais para a condução de
pesquisa adequada na área de sistemas computacionais
• Prover tecnologia que é de fato usada por aplicações e
usuários reais é muito gratificante!
Seminários da Física
22/27
Campina Grande, 9 de junho de 2009
Obrigado pela atenção!
Perguntas?
• Um bom lugar para começar a conhecer
mais sobre o OurGrid é:
– Labs of the world, unite!!! W. Cirne, F. Brasileiro, N.
Andrade, L. Costa, A. Andrade, R. Novaes, M. Mowbray.
Journal of Grid Computing 4 (3) (2006) 225-246.
E visitem
http://www.ourgrid.org/!
Seminários da Física
23/27
Campina Grande, 9 de junho de 2009
Download

LabsDoMundoDF-UFCG - Universidade Federal de Campina