
GPT-5 a-t-il vraiment fait des miracles en maths ? L’annonce triomphale d’OpenAI s’est transformée en controverse lorsque des chercheurs et figures du secteur ont pointé une confusion majeure entre découvertes inédites et références déjà publiées.
Un emballement vite douché
Tout est parti d’un message effacé depuis, attribué à un vice‑président d’OpenAI, affirmant que GPT-5 avait trouvé des solutions à 10 problèmes d’Erdős et avancé sur 11 autres. Problème : Thomas Bloom, mathématicien et mainteneur d’un site listant ces conjectures, a précisé que les entrées marquées « ouvertes » signifiaient seulement qu’il n’avait pas connaissance d’une solution, pas qu’il n’en existait aucune dans la littérature.

En clair, GPT-5 n’a pas « résolu » des conjectures inédites : il a retrouvé des solutions déjà publiées, passées sous le radar du site de Bloom. L’aveu est venu ensuite d’un chercheur d’OpenAI, qui a reconnu que « seules des solutions présentes dans la littérature ont été trouvées », tout en défendant la difficulté réelle de la recherche bibliographique.
La réaction du milieu ne s’est pas fait attendre : Demis Hassabis a parlé d’un épisode « gênant », tandis que Yann LeCun a ironisé sur l’excès d’enthousiasme entourant l’annonce. Au-delà du bad buzz, l’affaire rappelle une réalité technique : fouiller efficacement des décennies de publications est utile, mais cela ne vaut pas validation de percées mathématiques. La nuance entre « retrouver » et « démontrer » reste essentielle, surtout quand on parle de conjectures historiques.
Qui sait, avec AMD dans la course, GPT-6 parviendra peut-être à résoudre des conjectures inédites : AMD x OpenAI : Partenariat pour 6 GW d’IA en 2026 avec MI450
Pourquoi c’est important
Pour la recherche, l’apport potentiel des IA comme GPT-5 à la veille bibliographique est réel. Mais pour la crédibilité, la communication doit distinguer agrégation de connaissances et production de nouvelles preuves. Une vigilance indispensable, notamment dans des domaines où la validation par pairs fait loi.
Source : Techcrunch