Réouverture de l’accès au cluster « Osaka »

L’ensemble des éléments hardware du serveur de calcul Osaka ont été déménagés dans un data-center localisé à Lognes. Osaka a été stoppé le jeudi 28 juillet pour démontage. Les éléments ont été déplacés et remontés durant la première semaine d’aout. La seconde semaine d’aout a été consacrée à des mises à jours de l’ensemble des firmwares et drivers, la connexion à des volumes d’un nouveau NAS, ainsi qu’à la mise en place d’un système de management à distance (Lognes n’est pas ce que l’on peut appeler la porte à coté). Vous constaterez également que nous avons retiré du cluster certains vieux nœuds, qui présentaient des dysfonctionnements.

Toutes ces opérations sont transparentes pour les utilisateurs et le fonctionnement du cluster n’a pas changé.

Ajout de 8 nouveaux noeuds

Après la perte de noeuds du pool QDR et la mise hors service du pool SDR, voici de bonnes nouvelles avec la mise en service de huit nouveaux noeuds Dell PowerEdge C6420, numérotés de 81 à 88. Ces nouveaux noeuds sont identiques aux noeuds 77 à 80 : carte mère bi-socket avec des processeurs Intel Xeon Gold 6230R possédant 26 coeurs (soit 52 coeurs de calcul par noeud) et 384 Go de RAM par noeud.

Au total, ce sont 448 coeurs de calcul et 3 To de RAM qui s’ajoutent aux ressources d’osaka. Soit 4 fois plus de puissance de calcul et 7 fois plus de RAM que l’ancien pool SDR pour 5 fois moins de consommation électrique. Ces nouveaux noeuds, comme tous ceux du pool EDR, sont uniquement éligibles aux jobs parallèles.

Déménagement du CDC

Le Centre de Calcul quitte le site de Saint-Martin pour s’installer dans le batiment « Ordinal », avec les équipes de la Direction du Numérique. Le batiment Ordinal est situé entre le site des Chênes et le site de Saint-Martin.

Pour info, les services de proximité de la DirNum ne sont (presque) pas affectés par ce déménagement.

Fin de vie du pool SDR

Les noeuds du pool SDR sont désactivés à la soumission de jobs depuis les pics de chaleur de cet été. Ils n’ont pas été réactivés depuis et ne le seront plus jamais : le pool SDR est officiellement démentelé et retiré des ressources d’Osaka.

Les 14 noeuds du pool SDR d’Osaka ont tous été mis en service en 2009, ce qui représente 12 ans de service, dont 8 ans hors garantie (ce qui signifie une maintenance « system D »). Ils étaient réservés depuis 2019 à l’exécution de jobs séquentiels. Cette charge est désormais entièrement dévolue au pool QDR.

La fin du pool SDR représente la perte de 112 coeurs de calculs et 448 Go de RAM. Ce qui représente à peu près deux noeuds de calcul modernes (comme le noeud80). Pour 5 à 6 fois moins de consommation électrique. Oui, le pool SDR était obsolète.