
Le mainteneur de chardet a publié la version 7.0 d’un des détecteurs d’encodage les plus utilisés de l’écosystème Python, après une réécriture complète en cinq jours appuyée par l’outil Claude Code. Ars Technica rapporte un gain de performances maximal de 48 fois par rapport à la 6.0, mais l’onde de choc ne vient pas que du bench : le changement de licence, de la LGPL vers la MIT, a déclenché une contestation frontale de l’auteur initial.
Réécriture « propre » assistée par IA, licence relâchée
Pour espérer une intégration au standard library, Dan Blanchard dit avoir repris le projet à zéro dans un dépôt vide, guidé par des spécifications et des documents de conception, en générant le nouveau code via Claude puis en itérant manuellement. Dans la foulée, le passage à la MIT ouvre l’usage à des produits propriétaires, là où la LGPL imposait des contraintes de redistribution et de liens dynamiques.
Mark Pilgrim, créateur du projet en 2006, dénonce une « relicensing » illégale. Selon lui, l’implication historique du mainteneur dans le code d’origine invalide toute prétention de « clean room », et l’intervention d’un générateur de code ne confère aucun droit supplémentaire. Il exige le retour immédiat à la LGPL.
Similarité faible, zone grise juridique
Blanchard s’appuie sur JPlag pour étayer l’indépendance du nouveau code : chardet 7.0 et 6.0 n’afficheraient qu’un maximum de 1,29 % de similarité par fichier, quand des versions antérieures dépassaient 80 %. Il affirme que la structure, l’architecture et l’implémentation ont été reconçues, chiffres à l’appui.
Reste le talon d’Achille : les modèles d’IA ont probablement été entraînés sur les versions ouvertes de chardet. La question de savoir si cette « connaissance préalable » rend la sortie dérivative n’a pas d’arbitrage judiciaire à ce stade. L’examen et la correction humaines du code généré ajoutent une couche d’ambiguïté supplémentaire.
Réactions de fond dans l’open source
La Free Software Foundation, par la voix de Zoë Kooyman, estime qu’un modèle ayant ingéré le code original ne peut prétendre à une salle blanche. Bruce Perens alerte sur une rupture économique pour l’industrie logicielle, d’une ampleur qu’il compare à l’imprimerie. En filigrane, c’est la soutenabilité des projets historiques et la gouvernance des licences qui sont questionnées.
Si les gains réels de performance se confirment en production, chardet 7.0 deviendra un cas d’école autant technique que légal. Entre optimisation spectaculaire, ambition d’atterrir dans la stdlib et bascule vers MIT, le projet cristallise une tension irréconciliée pour l’instant : utiliser l’IA comme accélérateur sans brouiller la chaîne de droits, dans un cadre où ni les outils ni la jurisprudence ne sont stabilisés.
Source : ITHome