CMS T0
Samir Cury - 22/03/2012

Jan -> Mar 2012
CMSSW & (muito) uso de memória

Cenário de 2011



Como consequência só pudemos utilizar 70% dos recursos
disponíveis (pior caso 6/8 cores por nó)
Entre 2011 e 2012



CMSSW consome 2.6~3 GB de memória
Taskforce do grupo Offline para otimizar o uso de memória
Principal achievement – memory allocator (JEMalloc) – presente
como padrão no CMSSW 5_X_X
Início de 2012



Taskforce da T0 para testes de performance e tuning do sistema
para uso ótimo dos recursos.
Chegando a um limiar perigoso mas que vale a pena, onde
podemos usar de novo 100% dos recursos
Próximo slide é a cópia do management report sobre este tópico,
na última CMS Week
Primeiros beams não-oficiais





Esta semana começamos com testes de
squeeze nos detectores, Stable beams não
declarado ainda, mas prótons circulando.
HLT Menu já mudou de Cosmics para Interfill
(usado entre physics (menu de colisões com
stable beams))
Stable Beams previsto para o incio
Global Runs e outros exercícios para ter
certeza que tudo funciona, do P5 à T0.
Release previsto para o data-taking 2012A CMSSW_5_2_X
T1 PromptReco - motivação

Luminosidade >> 2011

Pile Up >> 2011

8 TeV

Isto implica em tempo de reconstrução
maior(40~60s por evento)

Para manter tudo que se tinha no ano passado



mesmos PDs na mesma frequência de trigger
precisaremos de mais job slots do que a T0 tem
disponível (3700~4000).
Daí veio a idéia de utilizar os recursos das T1
T1 PromptReco

Pessoalmente, uma quebra do modelo de computação do CMS



T1 – MC GEN-SIM, (Re)Reco(Data&MC)

T2 – Analysis + MC
Proposta




T0 – Repack (RAW), Express (DQM Online+AlCa+etc),
PromptReco(RECO+DQM Offline+etc),etc.
300 Hz Reconstruídos na T0 (como sempre)
Mais 300 Hz serão reconstruídos nas T1(!!!), Não haverá
DQM, Skims (a princípio).
Não serão Primary Datasets usados para certificação de
dados. Somente os menos importantes
Mesmo assim, será um subsistema da T0 e
gerenciado/Mantido por nós
Sobre minhas atividades

Treinamento do operador @ FNAL concluído

Agora temos alguém para trabalhar enquanto
durmo


Agora tenho mais tempo para desenvolvimento



O que se ganha de tempo se perde em organização.
Última release do WMCore contém 2 patches meus,
implementando uma funcionalidade de JobRetry especial
para a T0, e o suporte para isto no sistema
base(WMAgent).
WMCore 0.8.31
Além do que já sabem, que em duas frases, teste de
releases do CMSSW na infra-estrutura da T0, e diversos
testes/reports de performance para o grupo Offline.
Download

tuning - Indico