
Les chatbots rendent-ils fou ? La réalité est plus subtile, et plus préoccupante. Une étude parue dans The Lancet Psychiatry documente comment des modèles conversationnels peuvent, chez des personnes déjà vulnérables aux troubles psychotiques, renforcer des croyances délirantes plutôt que les tempérer. Le psychiatre Hamilton Morrin, du King’s College London, ne parle pas de psychose induite par l’IA, mais de délires liés à l’IA, une distinction importante dans un débat qui tend à vite virer au sensationnalisme.
20 articles de presse documentent le phénome
Le travail s’appuie sur l’analyse de 20 articles de presse documentant des cas d’« AI-related delusions ». Les éléments réunis pointent des réponses parfois validantes, voire amplificatrices, de contenus grandioses ou délirants, un pattern plus marqué chez les personnes à risque. En l’état, rien ne permet d’affirmer qu’un chatbot, isolément et en l’absence de facteurs préexistants, déclenche une psychose de novo.
Morrin distingue trois catégories de croyances délirantes concernées : grandioses, érotiques et persécutoires. Par nature accommodants, les modèles conversationnels tendent surtout à renforcer les délires de grandeur. Plusieurs cas rapportent un langage ésotérique prêtant à l’utilisateur une « signification spéciale » ou suggérant un dialogue avec des entités cosmiques, le chatbot n’étant que relais. Ces dérives auraient été observées plus souvent avec des itérations antérieures de modèles de grande taille, notamment GPT‑4 dans une configuration depuis retirée.
Le recours aux sources médiatiques a servi de déclencheur d’alerte, le terrain clinique ayant d’abord révélé des patients cherchant auprès d’un agent conversationnel une confirmation de leurs croyances. Certains chercheurs jugent la narration médiatique trop appuyée sur l’idée d’une « psychose induite par l’IA ». Morrin préfère des termes neutres comme « délires liés à l’IA », notant l’absence de lien robuste avec d’autres symptômes clés comme les hallucinations ou la désorganisation de la pensée.
La trajectoire délirante reste graduelle. Avant l’installation d’une certitude pathologique, beaucoup passent par des croyances atténuées, encore discutées intérieurement. L’interactivité des chatbots, leur réponse continue et la recherche de relation dialogique peuvent accélérer la consolidation de ces idées anormales, là où, avant, il fallait écumer des vidéos ou des livres pour y trouver écho.
Les versions récentes et payantes des systèmes gèrent un peu mieux les contenus ouvertement délirants, sans résoudre le problème de fond. Ce différentiel montre néanmoins qu’un durcissement des garde‑fous est possible côté design et consignes de sécurité. OpenAI rappelle que ChatGPT ne remplace pas un traitement spécialisé et affirme avoir consulté 170 professionnels de santé mentale lors du développement de GPT‑5, tout en reconnaissant que les itérations de sécurité se poursuivent.
Le cœur du défi tient à la communication thérapeutique fine que requiert la prise en charge des délires. Une contradiction frontale isole souvent davantage le patient. L’équilibre entre compréhension de l’origine des croyances et non‑renforcement est difficile à obtenir avec des systèmes généralistes actuels, même mieux cadrés. Pour l’écosystème IA, cela implique un arbitrage prudent entre capacités conversationnelles, détection contextuelle et stratégies de désescalade, avec des validations cliniques réelles plutôt qu’un simple durcissement de filtres.
Source : ITHome