Ling-2.6-1T : Trillion Optimisé Pour Agents Et Coûts

Ant Ling-2.6-1T : modèle trillion optimisé pour agents et coûts token réduits

Ant Group ouvre aujourd’hui Ling-2.6-1T, un modèle « trillion-scale » présenté comme un socle exécutable pour des workflows réels plutôt qu’un simple record de paramètres. Le groupe insiste sur un objectif d’« intelligence utile » avec un coût de génération contenu, une exécution multi‑étapes plus fiable et une intégration outillée pensée pour les environnements de production.

Architecture et coût de token

Ling-2.6-1T s’appuie sur un hybride MLA + Linear Attention afin de réduire l’empreinte mémoire et la latence sur longs contextes, tout en limitant la « chaîne de pensée » inutile via un schéma de récompense qui pénalise le verbiage intermédiaire. Objectif annoncé : conserver un plafond de capacité associé au cap des 1T de paramètres, mais privilégier un « fast thinking » pour atteindre la réponse correcte en moins de tokens.

Exécution multi‑étapes et benchmarks

Le modèle cible explicitement les agents outillés, le coding et les workflows complexes où l’orchestration compte plus que la simple justesse ponctuelle. Ant Group avance des scores SOTA open source sur des suites d’exécution comme AIME26, SWE‑bench Verified, BFCL‑V4, TAU2‑Bench et IFBench, signalant une meilleure tenue en contexte bruyant, la gestion d’états intermédiaires et un suivi d’instructions moins erratique.

Intégration développeur et disponibilité

Ling-2.6-1T se veut prêt pour les chaînes d’outils existantes, compatible avec les frameworks d’agents mainstream, et couvre du codegen à la correction de bugs sur des pipelines réels. Ant Group prolonge d’une semaine l’accès API gratuit via OpenRouter pour favoriser les tests et l’évaluation. Les poids sont disponibles sur Hugging Face et ModelScope.

Si Ant Group livre réellement la promesse d’un trillion « exploitable » avec des coûts token sous contrôle, l’intérêt est moins dans la démonstration de taille que dans la réduction du TCO des workflows outillés. Dans un paysage où l’on empile des étapes d’agent et des appels outils, la capacité à converger vite et proprement vaut plus qu’un raisonnement prolixe. Les prochains retours terrain, notamment sur les charges CI/CD et la résilience aux contraintes d’entreprise, diront si le pari « fast thinking » tient la distance.

Source : ITHome

Ant Ling-2.6-1T : modèle trillion optimisé pour agents et coûts token réduits

Architecture et coût de token

Exécution multi‑étapes et benchmarks

Intégration développeur et disponibilité

Articles similaires

Wael.K

Lire le suivant

IA médicale OpenAI : un modèle surpasse des cliniciens aux urgences

Google prépare des publicités dans Gemini, avec un déploiement mobile testé et cadré

Ryzen AI Halo mini-PC : lancement visé en juin pour la boîte IA d’AMD sous Strix Halo

OpenAI Codex iPhone : de l’agent de dev à l’app de productivité mobile

Meta entraîne ses agents IA avec les clics salariés, sans opt-out possible

IA médicale OpenAI : un modèle surpasse des cliniciens aux urgences

Google prépare des publicités dans Gemini, avec un déploiement mobile testé et cadré

Ryzen AI Halo mini-PC : lancement visé en juin pour la boîte IA d’AMD sous Strix Halo

OpenAI Codex iPhone : de l’agent de dev à l’app de productivité mobile

Meta entraîne ses agents IA avec les clics salariés, sans opt-out possible