Vous aviez une question à poser à ChatGPT? Comment vous assurer que tout est juste dans la réponse?keystone / montage (question posée à fins d'illustration)

«Il faut rester très prudent»: attention aux hallucinations de l'IA

Alors que l'intelligence artificielle s’impose dans le quotidien des Suisses, la confiance qu’on lui accorde reste fragile. Et à juste titre: les «hallucinations», ces réponses fausses, mais plausibles données par l'IA, soulèvent des enjeux majeurs. On fait le point avec une spécialiste.

07.06.2026, 21:0007.06.2026, 21:00

Alexandre Cudré

Près de 61% des Suisses estiment que «la crédibilité des informations» rapportées par l'intelligence artificielle (IA) «constitue un problème majeur». C'est un des résultats du deuxième «baromètre sur la cybersécurité», mandaté par l'assureur Axa et réalisé par l'institut Sotomo. Publiée le 20 avril, l'enquête représentative a été menée auprès de 1490 Romands et Alémaniques.

Il faut dire que l'IA n'est pas toujours dans le juste. Qu'il s'agisse de ChatGPT, Gemini ou Claude, les cas «d'hallucinations», c'est-à-dire d'erreurs plausibles commises par notre interlocuteur virtuel, restent présentes. Et on ne les repère pas toujours. Anna Jobin, professeure à l'Institut interdisciplinaire Human-IST de l'Université de Fribourg explique.

Anna Jobin, presidente de la Commission federale des medias, parle lors de la 6eme edition du Forum des medias romands, FMR, ce mercredi 19 novembre 2025 a Lausanne. (KEYSTONE/Cyril Zingaro)

Anna Jobin.Keystone

C'est quoi, une hallucination?
C'est une réponse présentée par un programme de modèle de langage (LLM), c'est-à-dire une intelligence artificielle, qui paraît juste, mais est en fait incorrecte ou incohérente. En tout cas, elle l'est pour l'être humain.

«Mais pour le LLM qui l'aura présenté, il s'agira d'un traitement de l'information comme un autre»

Quelle est la différence entre une erreur et une hallucination?
Une hallucination n'est pas nécessairement due à un bug ou à une malfonction du LLM utilisé. L'intelligence artificielle aura donné une réponse qu'elle juge adaptée, mais qui sera jugée fausse par l'humain.

Un exemple

Si l'IA vous dit: «Albert Einstein est un astrophysicien, né en 1879 en Autriche et mort en 1957 aux États-Unis», cela a l'air cohérent. Mais Einstein était physicien, il est né en Allemagne et mort en 1955. Les autres informations sont justes et les erreurs sont approximatives — mais cela reste des erreurs.

Cela tient au fonctionnement de l'IA?
L'intelligence artificielle ne distingue pas entre ce qui est vrai et ce qui est faux. Elle ne réfléchit pas, mais imite le langage humain sur la base de probabilités statistiques. Le terme d'intelligence est trompeur: c'est pour ça qu'on préfère l'appeler, techniquement, un modèle de langage. Il va se nourrir de diverses sources, soit trouvées en ligne, soit données par l'utilisateur, puis les traiter en morceaux d'informations et les transformer en représentations numériques. On appelle cela des vecteurs. Elle va reproduire du texte par association à coups de calculs de probabilités et de pondérations. C'est pareil avec les images générées par IA: le modèle visuel va traiter un ensemble de pixels et les réorganiser d'après leurs probabilités statistiques. C'est pareil pour une réponse sous forme de texte.

«Mais le modèle ne comprendra pas ce qu'il crée»

A propos des images IA 👇

«On commence à s'ennuyer»: les Suisses en ont marre des images IA

On peut aussi utiliser l'IA en lui fournissant des documents, par exemple un tableau statistique ou un texte de loi, puis de lui demander de trier l'information. Les hallucinations auront-elles toujours lieu?
Oui, les LLM peuvent aussi traiter des informations justes et en fournir une réponse erronée. Le risque est largement plus faible que s'il va puiser des informations en ligne, mais son fonctionnement par association peut tout de même produire des hallucinations.

Mais donc, comment savoir si ce qu'on lit sur ChatGPT est juste ou faux?

«Si on ne le vérifie pas, c'est impossible»

D'une certaine manière, tout ce qui sort de la machine est une hallucination. Ce sont les humains qui peuvent faire le tri. La machine ne fonctionnera pas par factualité, mais en fonction de sa conception de base, de ce qu'on lui a demandé de faire — via un prompt — et de l'information dont elle se nourrit. Si on veut être sûr, il faut toujours vérifier l'information et le passage cité via d'autres ressources. Si on ne se base que sur le texte qui est nous rendu par un LLM, soit l'output donné par la machine, il n'y a pas moyen à 100% de le savoir.

«La vraie méthode, ce serait de comparer méthodiquement ce que présente le LLM à plusieurs sources externes fiables»

On a perverti la nouvelle arme d’un célèbre musée romand

Mais il reste que certaines informations données par l'IA peuvent être dangereuses?
Absolument, il faut rester très prudent. On a vu des cas de recettes de cuisine proposées par l'intelligence artificielle qui se sont révélées toxiques. Le danger, c'est de croire qu'on peut apprendre quelque chose très vite et avoir l'impression de s'y connaître, alors que ce n'est pas le cas.

«Et selon le domaine, cela peut produire des comportements risqués»

Mais c'était déjà le cas avant les IA: les utilisateurs de Google avaient-ils tous l'habitude de vérifier leurs informations trouvées à chaque requête? La forme d'interaction a changé et l'apparence de conversation que l'on a avec ces IA peut donner une impression différente, mais suivre des conseils trouvés en ligne ne date pas d'hier. Mais je suis plutôt hésitante à blâmer les comportements individuels plutôt que les plate-formes qui offrent ces technologies.

C'est-à-dire?
Les entreprises de big tech qui produisent ces modèles auraient moyen de rendre les interactions plus sûres. La responsabilité principale se trouve du côté des prestataires de services. Il est possible de réaliser des audits techniques, par exemple, en testant les réponses d'une intelligence artificielle dans tous les sens jusqu'à s'assurer que le risque qu'elle donne des informations dangereuses soit considérablement limité. Cette technique porte le nom de «red teaming» dans le milieu de la cybersécurité. Il y en a d'autres, qui sont répandues et connues.

«Il n'y a donc pas de raison de croire que la big tech n'arriverait pas à rendre ses systèmes plus sûrs»

«La simulation devient la norme»: le pape critique l'IA

Alors, pourquoi ça ne se fait pas?
Cela demande des ressources, du temps, il faut parfois changer la gouvernance de l'entreprise et accepter des contrôles externes. Ce n'est pas juste une question d'ingénierie informatique, il s'agit de choix et de coûts très concrets. Ce n'est donc pas dans leurs intérêts, surtout si les autres compétiteurs ne le font pas.

«Pendant ce temps-là, il y a un risque, notamment pour les jeunes ou les personnes souffrant de détresse mentale»

Quelles peuvent être les conséquences pratiques d'une telle situation?
L'année dernière, un adolescent s'est suicidé aux Etats-Unis, en s'aidant des conseils de ChatGPT, qui a même validé et encouragé sa démarche désespérée.

«Cela ne devrait simplement pas arriver»

Et la société OpenAI, derrière ChatGPT, a été poursuivie par les parents.

On en parle ici:

ChatGPT lance une nouvelle fonction après le suicide d'un ado

Les hallucinations peuvent-elles être causées volontairement?
Oui, mais dans ce genre de cas, il s'agit bien souvent de tentatives de désinformation. Les réseaux de propagande pro-russes en ont fait leur spécialité: en laissant dans la nature des fausses informations, ils donnent à manger à ces modèles les informations qui les arrangent. L'IA ne faisant pas la distinction entre le vrai et le faux — une logique humaine, je le rappelle — elle va recracher des informations fausses. Cela s'appelle du «LLM poisoning», de l'empoisonnement à base de LLM. On connaît des cas où il a suffi de créer environ 250 faux sites web pour arriver à faire changer la réponse d'une IA.

«Quand on sait qu'on peut créer des sites entiers via des bots, cela montre que le danger est bien présent»

Faut-il, alors, se méfier de tout ce que ChatGPT, Gemini ou Claude nous disent?
Je ne suis pas sûre. Déjà, dans de nombreux cas, des réponses plausibles sont suffisantes pour l'usage qui en est fait...

«...à condition de rester vigilants sur les erreurs possibles»

Je me méfie plutôt d'un discours d'«inévitabilité», qu'on voit arriver à chaque nouvelle technologie. On le voit dans le monde du travail, avec la pression qui monte pour les utiliser sans se poser de questions pour raisons de productivité, avec un pouvoir économique en embuscade. De même, au niveau privé, on peut se passer d'une technologie ou décider de ne l'utiliser que dans un contexte donné ou un cas concret.

«Aucune technologie n'évolue toute seule et aucune n'est inévitable. Il faut pouvoir en parler de manière critique»

Plus d'articles sur l'intelligence artificielle: