
Entre l’IA agentique et les infrastructures financières, la bataille se joue désormais sur quelques microsecondes et sur la capacité à nourrir les cœurs sans goulot d’étranglement mémoire. HPE se positionne précisément sur ce terrain avec une nouvelle machine 2U pensée pour les charges les plus sensibles à la latence.
Dans ce contexte, le rapprochement avec le travail de NVIDIA autour d’un CPU pensé pour l’IA agentique, avec des gains annoncés en vitesse et en efficacité énergétique éclaire particulièrement bien la logique du DL394 Gen12 : HPE ne vend pas seulement une machine, mais une base de calcul conçue pour faire circuler les agents, les données et les décisions sans friction.
HPE ProLiant mise sur Vera pour les charges critiques
Présenté au COMPUTEX 2026, le HPE ProLiant Compute DL394 Gen12 rejoint le portefeuille NVIDIA AI Computing by HPE avec une disponibilité annoncée pour l’automne 2026. Le serveur repose sur le NVIDIA Vera CPU et vise explicitement les usages d’IA agentique, le traitement de données et les environnements où la latence et la régularité des performances comptent autant que le débit brut.

HPE inscrit ce lancement dans une collaboration avec NVIDIA et Redpanda, déjà explorée par le New York Stock Exchange. Le NYSE indique traiter plus de 1,1 trillion de messages par jour et compte sur cette plateforme pour augmenter sa capacité tout en réduisant encore la latence et en renforçant la résilience de son infrastructure de marché.
La référence au New York Stock Exchange fait aussi écho à des déploiements HPE où la mémoire, l’échelle et la résilience deviennent déterminantes, comme dans ce système HPE orienté charges critiques et grosses capacités mémoire, pensé pour absorber des volumes sensibles au moindre ralentissement.
Antonio Neri, CEO de HPE, met en avant la transition des modèles génératifs vers les systèmes agentiques, tandis que Jensen Huang affirme que Vera offre 2x l’efficacité et une exécution plus rapide des tâches que le x86. Ces promesses restent celles des industriels, mais elles éclairent bien le positionnement du DL394 Gen12 : servir de socle CPU à des déploiements IA où l’orchestration des flux devient aussi importante que l’accélération elle-même.
Mémoire, latence et sécurité au cœur du DL394 Gen12
HPE insiste sur l’architecture monolithique de Vera, opposée aux processeurs à grand nombre de cœurs basés sur des chiplets, plus exposés aux effets du NUMA, aux variations de latence et aux performances moins déterministes en environnement multiprocesseur. Le serveur exploite de la LPDDR5X et annonce une bande passante mémoire agrégée de 1,2 TB/s, soit jusqu’à 14 GB/s par cœur.
Dans l’idée, Vera agit ici comme un orchestrateur très haut débit capable d’ingérer et de traiter rapidement les données tout en équilibrant les ressources pour les charges IA les plus exigeantes. HPE met aussi en avant une réduction du gaspillage de capacité, un point loin d’être anecdotique sur des infrastructures dimensionnées pour absorber des pics de charge ou des traitements distribués continus.
Un socle Gen12 sécurisé et administrable à grande échelle
Sur la partie sécurité, le HPE ProLiant Compute DL394 Gen12 embarque le Silicon Root of Trust de HPE, iLO 7 et un secure enclave chargé de protéger le serveur sur l’ensemble de son cycle de vie. HPE affirme aussi que ces serveurs de nouvelle génération sont les premiers à répondre aux exigences du NIST en matière de sécurité résistante à l’informatique quantique, un argument destiné aux environnements réglementés et aux charges sensibles.
L’administration passe par HPE Compute Ops Management, présenté comme une couche unifiée pour piloter des environnements distribués, automatiser les opérations et réduire le temps consacré à la gestion des serveurs. Pour HPE, l’objectif est aussi de limiter le risque de perte de revenus liée aux indisponibilités, un angle qui parle évidemment davantage à la finance et aux grands déploiements IA qu’au datacenter généraliste.
Ce lancement montre surtout que la prochaine phase de l’IA en entreprise ne se limitera pas aux GPU. Quand HPE, NVIDIA et le NYSE mettent en avant la mémoire, la latence déterministe et l’orchestration CPU, le message est clair : sur les charges agentiques et temps réel, la plateforme complète redevient un différenciateur majeur face aux architectures x86 plus conventionnelles.
Source : TechPowerUp