
Ant Group ouvre aujourd’hui Ling-2.6-1T, un modèle « trillion-scale » présenté comme un socle exécutable pour des workflows réels plutôt qu’un simple record de paramètres. Le groupe insiste sur un objectif d’« intelligence utile » avec un coût de génération contenu, une exécution multi‑étapes plus fiable et une intégration outillée pensée pour les environnements de production.
Architecture et coût de token
Ling-2.6-1T s’appuie sur un hybride MLA + Linear Attention afin de réduire l’empreinte mémoire et la latence sur longs contextes, tout en limitant la « chaîne de pensée » inutile via un schéma de récompense qui pénalise le verbiage intermédiaire. Objectif annoncé : conserver un plafond de capacité associé au cap des 1T de paramètres, mais privilégier un « fast thinking » pour atteindre la réponse correcte en moins de tokens.
Exécution multi‑étapes et benchmarks
Le modèle cible explicitement les agents outillés, le coding et les workflows complexes où l’orchestration compte plus que la simple justesse ponctuelle. Ant Group avance des scores SOTA open source sur des suites d’exécution comme AIME26, SWE‑bench Verified, BFCL‑V4, TAU2‑Bench et IFBench, signalant une meilleure tenue en contexte bruyant, la gestion d’états intermédiaires et un suivi d’instructions moins erratique.
Intégration développeur et disponibilité
Ling-2.6-1T se veut prêt pour les chaînes d’outils existantes, compatible avec les frameworks d’agents mainstream, et couvre du codegen à la correction de bugs sur des pipelines réels. Ant Group prolonge d’une semaine l’accès API gratuit via OpenRouter pour favoriser les tests et l’évaluation. Les poids sont disponibles sur Hugging Face et ModelScope.
Si Ant Group livre réellement la promesse d’un trillion « exploitable » avec des coûts token sous contrôle, l’intérêt est moins dans la démonstration de taille que dans la réduction du TCO des workflows outillés. Dans un paysage où l’on empile des étapes d’agent et des appels outils, la capacité à converger vite et proprement vaut plus qu’un raisonnement prolixe. Les prochains retours terrain, notamment sur les charges CI/CD et la résilience aux contraintes d’entreprise, diront si le pari « fast thinking » tient la distance.
Source : ITHome