Eviden va étendre le supercalculateur Jean Zay

Eviden va étendre le supercalculateur Jean Zay

Eviden a été choisi par le GENCI et le CNRS pour fournir une extension au supercalculateur Jean Zay. Cette nouvelle infrastructure comprendra une extension basée sur des H100 Tensor Core de NVIDIA. L'ensemble doit être totalement disponible pour l'été 2024. 

Cette extension du calculateur Jean Zay augmentera sa puissance crête de calcul, la faisant passer de 36,85 à 125,9 PFlop/s. Ce faisant, les capacités de calcul disponibles seront multipliées par 3,5 en double précision (pour le calcul haute performance) et par 13 si on utilise une précision réduite ou mixte comme pour l'intelligence artificielle. En complément, une nouvelle infrastructure de stockage permettra de lire/écrire à haut débit et de mettre à disposition les modèles et jeux de données associés.

En plus de son niveau de performance, il faut souligner que Jean Zay est l’une des machines les plus éco-efficientes en Europe grâce à l'utilisation massive de technologies accélérées (GPU) et à un refroidissement des serveurs de calcul par eau chaude à cœur. La chaleur fatale de la machine est en outre réutilisée pour contribuer au chauffage de plus de 1 000 logements sur le plateau de Saclay (grâce à un investissement commun entre le CNRS et l’EPAPS[1]).

L’acquisition de cette extension, réalisée avec le soutien du ministère de l’Enseignement supérieur et de la Recherche, de la Direction Générale des Entreprises (ministère de l'Économie, des Finances et de la Souveraineté industrielle et numérique) et du Secrétariat général pour l’Investissement, en charge de France 2030, a bénéficié d’un financement de France 2030. L’IDRIS exploitera ainsi une machine de calcul à la puissance et aux fonctionnalités exceptionnelles, ouverte aux communautés de recherche académiques et industrielles nationales. Celles-ci pourront procéder à des simulations numériques par calcul haute performance et entraîner ou spécialiser des modèles d’intelligence artificielle dits « de fondation » ou « intelligence artificielle générative » que cela soit dans le domaine de traitement des langues, de la vision, de la multimodalité, de l’IA explicable, ou encore en biologie, santé, matériaux, nouvelles énergies et mobilités décarbonées, physique fondamentale, climat/météo, etc.

Cette évolution s’inscrit dans le cadre de l’annonce faite par le Président de la République Emmanuel Macron le 14 juin dernier au salon Vivatech, pour soutenir le développement de l’intelligence artificielle souveraine, notamment de l’IA générative. À cette fin, 40 M€ ont été attribués à GENCI. Cette subvention exceptionnelle s’accompagne également de 10 M€ pour renforcer et prolonger les ressources humaines du Programme national de recherche en intelligence artificielle (PNRIA) et accompagner les communautés IA. Il s’agit de garantir dans la durée la qualité du service fourni par le réseau CNRS des ingénieurs support en IA, qui aide les communautés IA à porter leurs projets sur Jean Zay.

Configuration

Au total après cette extension, Jean Zay sera doté de 1456 GPUs NVIDIA H100 auxquels il faut ajouter 416 GPUs NVIDIA A100 Tensor Core et 1832 NVIDIA V100 Tensor Core restants sur l’ancienne configuration. L’augmentation de puissance de Jean Zay sera apportée par 14 racks de calcul BullSequana XH3000 d’Eviden intégrant 364 serveurs bi-processeurs Intel Sapphire Rapids 48 cœurs, 512 Go de mémoire et 4 GPU NVIDIA H100 80 Go SXM5, interconnectés chacun par 4 NVIDIA ConnectX-7 liens réseau haut débit InfiniBand 400 Gb/s.

L’environnement de stockage sera complètement revu pour proposer un premier niveau de 4.3 Po en technologie flash (débits supérieurs à 1 To/s en lecture/écriture) et un second niveau de 39 Po en technologies disques rapides (débits supérieurs à 300 Go/s), tous deux sous Lustre et fournis par la société DDN.

Photo : © Cyril Fresillon/IDRIS/CNRS Photothèque