Ampere : une roadmap ambitieuse
Ampere voit grand avec une roadmap ambitieuse jusqu'à 2026 notamment autour du cloud et de l'IA. Ampere annonce aussi une collaboration avec Qualcomm pour créer une solution d'inférence basé sur Cloud AI 100 de Qualcomm.
Les principaux points à retenir :
Outre des mises à jour sur l'orientation et la vision de l’entreprise, plusieurs nouveautés sont prévues :
- Ampere collabore avec Qualcomm pour développer une solution commune comprenant les CPU Ampere et les accélérateurs Cloud AI100 Ultra de Qualcomm. Cette solution s'attaquera à l'inférence LLM sur les plus grands modèles d'IA générative de l'industrie.
- L'extension de la plate-forme à 12 canaux d'Ampere avec le prochain processeur AmpereOne à 256 cœurs de la société. Il utilisera les mêmes solutions thermiques refroidies par air que le CPU AmpereOne 192 cœurs existant et offrira plus de 40 % de performance en plus que n'importe quel CPU sur le marché aujourd'hui, sans conception exotique de la plateforme. La plateforme de mémoire à 12 canaux et 192 cœurs de la société est toujours attendue dans le courant de l'année.
- Une mise à jour indique que Llama 3 de Meta fonctionne désormais sur les CPU Ampere chez Oracle Cloud. Les données de performance montrent que l'exécution de Llama 3 sur le CPU Ampere Altra 128 cœurs sans GPU offre les mêmes performances qu'un GPU Nvidia A10 associé à un CPU x86, tout en utilisant un tiers de la puissance.
- Annonce de la formation d'un groupe de travail UCIe dans le cadre de l'AI Platform Alliance. Dans ce cadre, l'entreprise a déclaré qu'elle s'appuierait sur la flexibilité de ses CPU en utilisant la technologie d'interface ouverte pour lui permettre d'incorporer d'autres éléments de propriété intellectuelle de ses clients dans ses futurs CPU.
- Nouvelles caractéristiques des performances d'AmpereOne et des plateformes OEM et ODM. AmpereOne continue de faire progresser la performance par watt d'Ampere, dépassant AMD Genoa de 50% et Bergamo de 15%. Pour les centres de données qui cherchent à rafraîchir et à consolider leur ancienne infrastructure afin de récupérer de l'espace, du budget et de l'énergie, AmpereOne offre jusqu'à 34% de performances supplémentaires par rack.
- De nouvelles plateformes AmpereOne OEM et ODM seront livrées dans les mois à venir.
- Annonce d'une solution commune avec NETINT utilisant les puces de traitement vidéo Quadra T1U et les CPU Ampere pour transcoder simultanément 360 chaînes en direct et sous-titrer en temps réel 40 flux dans de nombreuses langues en utilisant le modèle Whisper d'OpenAI.
- En plus des fonctions existantes telles que le marquage de la mémoire, l'application de la qualité de service et la gestion de la congestion du maillage, Ampere a révélé une nouvelle fonction FlexSKU, qui permet aux clients d'utiliser le même SKU pour répondre à des cas d'utilisation de type scale-out et scale-up.