
Le coût des agents IA ne baisse pas aussi vite que les promesses du cloud. Dell mise donc sur l’inférence locale, au plus près des données, avec une gamme pensée pour faire passer l’agentic AI du poste de travail au datacenter sans changer de pile logicielle.
Dell Deskside Agentic AI cible l’IA agentique en local
Dell Technologies ajoute Dell Deskside Agentic AI à son Dell AI Factory with NVIDIA. L’idée est simple sur le papier : permettre à des groupes de travail de déployer et de faire évoluer des workflows d’IA agentique localement, en évitant les contraintes de coût, de latence et de souveraineté des données associées à une approche 100 % cloud.
Dell met aussi en avant la prise en charge de NVIDIA OpenShell sur l’ensemble du Dell AI Factory with NVIDIA. L’éditeur promet ainsi une couche unique de sécurité et d’application des politiques, depuis les stations deskside jusqu’aux serveurs Dell PowerEdge XE.
Le constructeur part d’un constat désormais classique sur les déploiements d’IA agentique : l’usage de tokens augmente rapidement à mesure que les architectures deviennent plus autonomes. Même avec une baisse du prix unitaire des tokens, Dell estime que l’équation économique du cloud seul devient difficile à tenir à l’échelle, en particulier lorsque s’ajoutent les questions de sécurité et de localisation des données.
Des configurations allant de 30 milliards à 1 trillion de paramètres
Dell affirme que plus de 50 % des workflows agentiques s’exécutent sur des modèles open-weight. La gamme annoncée vise précisément cette zone, avec des systèmes capables de couvrir des modèles de 30 milliards à 284 milliards de paramètres pour le raisonnement courant, puis de monter plus haut selon les configurations.
Trois classes de machines selon la charge
Premier niveau, le Dell Pro Max with GB10 se présente comme une machine compacte et sobre en énergie pour le prototypage individuel à petite échelle, avec une prise en charge annoncée de modèles allant de 30 milliards à 200 milliards de paramètres.
Au-dessus, le Dell Pro Precision 9 s’adresse au segment workstation en tour. La plateforme repose sur des processeurs Intel Xeon 600 et peut embarquer jusqu’à cinq GPU NVIDIA RTX PRO Blackwell Workstation Edition, pour des charges GPU plus lourdes et des modèles allant de 30 milliards à 500 milliards de paramètres.
Enfin, le Dell Pro Max with GB300 est construit autour du NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip et de la technologie maison MaxCool. Dell le positionne sur l’inférence de modèles dits frontier-level, de 120 milliards jusqu’à 1 trillion de paramètres.
Pour la couche logicielle, l’offre s’appuie sur la NVIDIA NemoClaw reference stack, une base open source destinée à gérer des agents IA persistants et toujours actifs, bâtie sur OpenClaw. Dell cite aussi les modèles ouverts NVIDIA Nemotron pour le raisonnement et le code, ainsi que le runtime sécurisé d’OpenShell, l’ensemble s’inscrivant dans le NVIDIA Agent Toolkit.
Dell ajoute ses services pour couvrir toute la chaîne, de la stratégie initiale au déploiement matériel, jusqu’à l’alignement des workflows, la priorisation des agents et l’optimisation continue. Sur le plan financier, le groupe avance un point d’équilibre face aux API de cloud public en trois mois dans certains cas, puis une réduction des dépenses pouvant atteindre 87 % sur deux ans.
Une pile commune avec OpenShell et AI-Q 2.0
Le point le plus structurant reste probablement l’unification de la pile d’exécution. NVIDIA OpenShell, désormais pris en charge sur tout le Dell AI Factory with NVIDIA, fournit l’environnement sandboxé destiné à construire, déployer et gouverner les agents avec des contrôles de confidentialité et de sécurité à l’exécution.
Cette compatibilité couvre les stations hautes performances Dell comme les serveurs Dell PowerEdge XE, sur Canonical Ubuntu et Red Hat AI. Dell insiste sur l’intérêt d’un développement et d’un déploiement plus proches des données pour renforcer gouvernance, sécurité et contrôle opérationnel.
Le constructeur annonce aussi la prise en charge du blueprint NVIDIA AI-Q 2.0 pour accélérer le passage du pilote à la production sur des workflows multi-agents liés à la recherche, à l’aide à la décision ou à des tâches complexes. Cette brique existe désormais sous la forme d’une Dell-NVIDIA AI-Q 2.0 Reference Architecture, alimentée par la Dell AI Data Platform, et pensée pour des déploiements on-premises exigeants dans la finance, le secteur public et l’industrie manufacturière.
L’ensemble est disponible dès maintenant : Dell Deskside Agentic AI, NVIDIA OpenShell sur Ubuntu et Red Hat AI dans le Dell AI Factory with NVIDIA, NVIDIA AI-Q 2.0 pour cette même plateforme, ainsi que la Dell-NVIDIA AI-Q 2.0 Reference Architecture. Dell ne communique en revanche aucun tarif, ce qui laisse pour l’instant les promesses de retour sur investissement sans véritable point d’ancrage public.
Cette annonce illustre surtout un déplacement du marché entreprise : l’IA générative locale n’est plus seulement un sujet de confidentialité, mais aussi un arbitrage d’infrastructure. Entre le poste de travail dopé au Blackwell et le serveur XE, Dell tente de verrouiller toute la montée en charge avec NVIDIA, à un moment où la maîtrise des coûts d’inférence devient presque aussi stratégique que la performance brute.
Source : TechPowerUp