Les CPU ARM : Google relance la course aux CPU dédiées IA
L'IA n'est pas seulement une course dans les services proposés aux utilisateurs. Les puces dédiées sont vitales pour les performances et les fonctionnalités autour de l'IA. Google travaille depuis plusieurs années sur le sujet avec les TPU : Tensor Processing Unit. Google a annoncé il y a quelques jours un nouveau CPU Arm : Axion. Il se dédie aux workloads IA. Mais il devrait être déployé dans Google Cloud courant 2024.
Pour Google, Axion est une puce stratégique pour les services cloud. Elle offrira des performances largement meilleures aux Arm actuels et aux puces x86. Plus globalement, il s'agit aussi de construire des composants pouvant remplacer les GPU NVIDIA. Ainsi, TPU v5p est un monstre de puissance : un pod v5p contient 8960 puces ! C'est aussi une réponse aux récentes annonces de Microsoft sur les nouvelles composants sur mesure pour Azure et l'IA en général. AWS avait dévoilé son Graviton3.