Ant Ling-2.6-1T : modèle trillion optimisé pour agents et coûts token réduits

Ant Group ouvre aujourd’hui Ling-2.6-1T, un modèle « trillion-scale » présenté comme un socle exécutable pour des workflows réels plutôt qu’un simple record de paramètres. Le groupe insiste sur un objectif d’« intelligence utile » avec un coût de génération contenu, une exécution multi‑étapes plus fiable et une intégration outillée pensée pour les environnements de production.

Architecture et coût de token

Ling-2.6-1T s’appuie sur un hybride MLA + Linear Attention afin de réduire l’empreinte mémoire et la latence sur longs contextes, tout en limitant la « chaîne de pensée » inutile via un schéma de récompense qui pénalise le verbiage intermédiaire. Objectif annoncé : conserver un plafond de capacité associé au cap des 1T de paramètres, mais privilégier un « fast thinking » pour atteindre la réponse correcte en moins de tokens.

Exécution multi‑étapes et benchmarks

Le modèle cible explicitement les agents outillés, le coding et les workflows complexes où l’orchestration compte plus que la simple justesse ponctuelle. Ant Group avance des scores SOTA open source sur des suites d’exécution comme AIME26, SWE‑bench Verified, BFCL‑V4, TAU2‑Bench et IFBench, signalant une meilleure tenue en contexte bruyant, la gestion d’états intermédiaires et un suivi d’instructions moins erratique.

Intégration développeur et disponibilité

Ling-2.6-1T se veut prêt pour les chaînes d’outils existantes, compatible avec les frameworks d’agents mainstream, et couvre du codegen à la correction de bugs sur des pipelines réels. Ant Group prolonge d’une semaine l’accès API gratuit via OpenRouter pour favoriser les tests et l’évaluation. Les poids sont disponibles sur Hugging Face et ModelScope.

Si Ant Group livre réellement la promesse d’un trillion « exploitable » avec des coûts token sous contrôle, l’intérêt est moins dans la démonstration de taille que dans la réduction du TCO des workflows outillés. Dans un paysage où l’on empile des étapes d’agent et des appels outils, la capacité à converger vite et proprement vaut plus qu’un raisonnement prolixe. Les prochains retours terrain, notamment sur les charges CI/CD et la résilience aux contraintes d’entreprise, diront si le pari « fast thinking » tient la distance.

Source : ITHome

Wael.K

Ravi de vous accueillir sur ma page dédiée aux articles ! Je suis Wael El Kadri, et je suis un ingénieur civil de profession. Mais ma véritable passion est le matériel informatique. J'en suis passionné depuis l'âge de 12 ans, et j'aime apprendre et découvrir de nouvelles choses. En 2016, j'ai créé ma page personnelle sur les réseaux sociaux, baptisée Pause Hardware. C'est là que je partage mes créations en modding, mais aussi divers sujets liés au matériel informatique en général. J'ai également crée le site web, pausehardware.com, en 2019 où je publie des articles plus approfondis sur le matériel à travers des tests et revues et articles de news. J'ai eu l'opportunité de participer en tant qu'exposant à plusieurs événements liés aux jeux vidéo, aux côtés de grandes marques, notamment lors de la Paris Game Week en 2018 et 2019. Je reste constamment en quête de nouvelles manières de partager mes connaissances et ma passion pour le matériel informatique avec d'autres passionnés. Voici quelques publications médiatiques qui ont mis en lumière mon travail : Deux articles dans le magazine Extreme PC, parus dans ses  numéros 1 et 21 : Extreme PC Magazine Issue 21 (adobe.com) Également, un article sur Forbes intitulé "Dix Modèles de PC Incroyables en 2021" sur forbes.com : Ten Incredible PC Mods Of 2021 (forbes.com)
guest
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Vous aimez PauseHardware ?
Ajoutez-nous à vos sources favorites sur Google pour voir apparaître nos contenus directement dans votre fil d’actualité.
⭐ Ajouter Non merci
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x