Geração de Cenários para Desktop Computing paralela e Felipe L. Severino Felipe L. Severino 1 Geração de Cenários para Desktop Computing Sumário Desktop Computing; BOINC/SETI@HOME; Objetivos; Plataforma; Disponibilidade; Considerações Finais. Felipe L. Severino 2 PDP Geração de Cenários para Desktop Computing Desktop Computing Computação voluntária; Utilização de ciclos idle de máquinas domésticas; Ambientes computacionais: Extremamente heterogêneos; Largamente distribuídos; Disponibilidade de hosts variável (estudos em andamento). Felipe L. Severino 3 PDP Geração de Cenários para Desktop Computing BOINC Berkeley Open Infrastructure for Network Computing; Plataforma para execução de Desktop Computing; Utilização de recursos computacionais ociosos; Utilizado em diversos projetos: Seti@Home; Rosseta@Home; Climateprediction.net; ... Felipe L. Severino 4 PDP Geração de Cenários para Desktop Computing BOINC Existem diversos sites que disponibilizam dados estatísticos sobre os projetos BOINC; Para este trabalho foi utilizado o site: http://boincstats.com Considerando-se apenas o projeto Seti@Home; Felipe L. Severino 5 PDP Geração de Cenários para Desktop Computing Seti@Home Um dos maiores projetos utilizando BOINC; Milhares de máquinas em todo o mundo; Capacidade computacional média de: 718.432 GFLOPS Felipe L. Severino 6 PDP Geração de Cenários para Desktop Computing Seti@Home Felipe L. Severino 7 PDP Geração de Cenários para Desktop Computing Seti@Home Estudo realizado por Javadi monitorou 230.000 hosts durante 1º de Abril de 2007 até 1º de Janeiro de 2009; O trabalho apresentado por Javadi teve foco no comportamento randômico dos hosts, analisando as disponibilidades destes hosts; Felipe L. Severino 8 PDP Geração de Cenários para Desktop Computing Seti@Home Felipe L. Severino 9 PDP Geração de Cenários para Desktop Computing Objetivos Utilizar os dados coletados para geração de cenários similares aos encontrados no projeto Seti@Home; Estes cenários poderão ser utilizados em simulações ou testes de escalonamento; Felipe L. Severino 10 PDP Geração de Cenários para Desktop Computing Plataforma Para geração de plataforma foram considerados: Número de hosts ativos nos últimos 60 dias (gráfico mostrado anteriormente); Poder computacional médio (718.432 GFLOPS); Dados da Intel sobre poder computacional de processadores; Devido a falta de dados foram desconsiderados: Largura de banda; Latência da rede; Felipe L. Severino 11 PDP Geração de Cenários para Desktop Computing Plataforma Poder computacional: Foi feita uma média de poder computacional dividindo-se o poder total pelo número de hosts; A partir desta média foi realizada uma distribuição Gaussiana considerando o poder computacional: Médio: 2604,13 – 2734,34 MFLOPS Mínimo: 100 MFLOPS (Intel Pentium 100 MHz) Máximo: 56.000 MFLOPS (Pentium Xeon, i7) Resultado pode ser visto na figura seguinte considerando 10.000 hosts; Felipe L. Severino 12 PDP Geração de Cenários para Desktop Computing Plataforma Felipe L. Severino 13 PDP Geração de Cenários para Desktop Computing Plataforma O programa gera um arquivo XML que segue os padrões de entrada do simulador SimGrid, que deverá ser utilizado por outros alunos; Felipe L. Severino 14 PDP Geração de Cenários para Desktop Computing Disponibilidade Para geração da disponibilidade foram utilizadas as análises apresentadas por Javadi (gráfico de disponibilidades); Segundo Javadi, 80% dos intervalos de disponibilidade contribuem para 10% da fração total; 20% contribuem para os demais 90%. Felipe L. Severino 15 PDP Geração de Cenários para Desktop Computing Disponibilidade Para a geração da disponibilidade foi estabelecido: Disponibilidade mínima: 30 segundos; Disponibilidade máxima: 200 horas; Quantidade de janelas de disponibilidade por host: 100. O resultado pode ser visto na figura seguinte, considerando 100 hosts (total de 10.000 janelas de disponibilidade). Felipe L. Severino 16 PDP Geração de Cenários para Desktop Computing Disponibilidade Felipe L. Severino 17 PDP Geração de Cenários para Desktop Computing Disponibilidade O programa, utilizando os dados mostrados anteriormente, gera um histórico de comportamento para cada host; Os períodos de indisponibilidade seguem os mesmos limites que a disponibilidade, porém com uma distribuição uniforme entre as janelas. Felipe L. Severino 18 PDP Geração de Cenários para Desktop Computing Disponibilidade O programa gera um arquivo XML contendo os hosts e seus históricos de disponibilidade; Felipe L. Severino 19 PDP Geração de Cenários para Desktop Computing Tela principal Felipe L. Severino 20 PDP Geração de Cenários para Desktop Computing Considerações Finais O tempo de geração de cenários reais é longo devido ao método de gravação em arquivo (deve ser otimizado); Foi seguido o padrão XML por ser portável e facilmente manipulável; Felipe L. Severino 21 PDP Geração de Cenários para Desktop Computing Considerações Finais As análises estatísticas podem ser confirmadas com estudos de traços reais (BOINC traces); Alguns dados (p.e., desvio padrão de distribuições) foram utilizados sem um estudo prévio; Estes valores, porém, não devem influenciar em trabalhos como comparativos entre escalonadores (objetivo deste trabalho). Felipe L. Severino 22 PDP Geração de Cenários para Desktop Computing paralela e Felipe L. Severino Felipe L. Severino 23