
DeepSeek accélère la cadence sur son API et augmente la capacité de service. L’éditeur annonce une sortie plus rapide, une stabilité renforcée et, par défaut, la prise en charge de 500 connexions simultanées. Les clients entreprise peuvent demander un plafond plus élevé selon leurs besoins.
Capacité et stabilité en hausse
Le relèvement du seuil de concurrence par défaut à 500 sessions vise les intégrateurs qui opèrent des déploiements massifs et des backends multitâches. DeepSeek met en avant une réduction de la latence de génération et une meilleure tenue sous charge, éléments critiques pour les cas d’usage temps réel et les chaînes d’agents.

Ce durcissement de capacité prend tout son sens quand on le replace dans la trajectoire plus large du modèle, déjà présenté comme un atout face aux offres plus gourmandes en calcul : pour approfondir cet angle marché et technique, notre dossier sur la manière dont DeepSeek a rebattu les cartes en misant sur l’efficacité et des besoins de calcul plus contenus éclaire bien le positionnement de la société.
Tarification de DeepSeek-V4-Pro après la promo
DeepSeek rappelle que la promotion à 2,5/10 s’achève le 31 mai 2026. À compter de cette date, l’API du modèle DeepSeek‑V4‑Pro passera à un tarif « 1/4 du prix catalogue initial » annoncé par la société, avec le détail suivant :
• Entrées avec cache: 0,025 ¥ / million de tokens (environ 0,0032 €).
• Entrées sans cache: 3 ¥ / million de tokens (environ 0,38 €).
• Sorties: 6 ¥ / million de tokens (environ 0,77 €).
À titre indicatif, les prix initiaux étaient respectivement de 0,1 ¥ (≈ 0,013 €), 12 ¥ (≈ 1,53 €) et 24 ¥ (≈ 3,06 €) par million de tokens.
Sur un plan marché, l’augmentation de la concurrence simultanée à 500 par défaut, combinée à une grille tarifaire désormais ancrée nettement sous l’euro par million de tokens en sortie, met la pression sur les offres d’API généralistes. Les intégrateurs à forte volumétrie, notamment ceux qui exploitent agressivement le cache contextuel, y trouveront un levier de coût immédiat, sous réserve que le niveau de service tienne ses promesses en situation de pointe.
Source : ITHome