«Il faut rester très prudent»: attention aux hallucinations de l'IA
Près de 61% des Suisses estiment que «la crédibilité des informations» rapportées par l'intelligence artificielle (IA) «constitue un problème majeur». C'est un des résultats du deuxième «baromètre sur la cybersécurité», mandaté par l'assureur Axa et réalisé par l'institut Sotomo. Publiée le 20 avril, l'enquête représentative a été menée auprès de 1490 Romands et Alémaniques.
Il faut dire que l'IA n'est pas toujours dans le juste. Qu'il s'agisse de ChatGPT, Gemini ou Claude, les cas «d'hallucinations», c'est-à-dire d'erreurs plausibles commises par notre interlocuteur virtuel, restent présentes. Et on ne les repère pas toujours. Anna Jobin, professeure à l'Institut interdisciplinaire Human-IST de l'Université de Fribourg explique.
C'est quoi, une hallucination?
C'est une réponse présentée par un programme de modèle de langage (LLM), c'est-à-dire une intelligence artificielle, qui paraît juste, mais est en fait incorrecte ou incohérente. En tout cas, elle l'est pour l'être humain.
Quelle est la différence entre une erreur et une hallucination?
Une hallucination n'est pas nécessairement due à un bug ou à une malfonction du LLM utilisé. L'intelligence artificielle aura donné une réponse qu'elle juge adaptée, mais qui sera jugée fausse par l'humain.
Cela tient au fonctionnement de l'IA?
L'intelligence artificielle ne distingue pas entre ce qui est vrai et ce qui est faux. Elle ne réfléchit pas, mais imite le langage humain sur la base de probabilités statistiques. Le terme d'intelligence est trompeur: c'est pour ça qu'on préfère l'appeler, techniquement, un modèle de langage. Il va se nourrir de diverses sources, soit trouvées en ligne, soit données par l'utilisateur, puis les traiter en morceaux d'informations et les transformer en représentations numériques. On appelle cela des vecteurs. Elle va reproduire du texte par association à coups de calculs de probabilités et de pondérations. C'est pareil avec les images générées par IA: le modèle visuel va traiter un ensemble de pixels et les réorganiser d'après leurs probabilités statistiques. C'est pareil pour une réponse sous forme de texte.
On peut aussi utiliser l'IA en lui fournissant des documents, par exemple un tableau statistique ou un texte de loi, puis de lui demander de trier l'information. Les hallucinations auront-elles toujours lieu?
Oui, les LLM peuvent aussi traiter des informations justes et en fournir une réponse erronée. Le risque est largement plus faible que s'il va puiser des informations en ligne, mais son fonctionnement par association peut tout de même produire des hallucinations.
Mais donc, comment savoir si ce qu'on lit sur ChatGPT est juste ou faux?
D'une certaine manière, tout ce qui sort de la machine est une hallucination. Ce sont les humains qui peuvent faire le tri. La machine ne fonctionnera pas par factualité, mais en fonction de sa conception de base, de ce qu'on lui a demandé de faire — via un prompt — et de l'information dont elle se nourrit. Si on veut être sûr, il faut toujours vérifier l'information et le passage cité via d'autres ressources. Si on ne se base que sur le texte qui est nous rendu par un LLM, soit l'output donné par la machine, il n'y a pas moyen à 100% de le savoir.
Mais il reste que certaines informations données par l'IA peuvent être dangereuses?
Absolument, il faut rester très prudent. On a vu des cas de recettes de cuisine proposées par l'intelligence artificielle qui se sont révélées toxiques. Le danger, c'est de croire qu'on peut apprendre quelque chose très vite et avoir l'impression de s'y connaître, alors que ce n'est pas le cas.
Mais c'était déjà le cas avant les IA: les utilisateurs de Google avaient-ils tous l'habitude de vérifier leurs informations trouvées à chaque requête? La forme d'interaction a changé et l'apparence de conversation que l'on a avec ces IA peut donner une impression différente, mais suivre des conseils trouvés en ligne ne date pas d'hier. Mais je suis plutôt hésitante à blâmer les comportements individuels plutôt que les plate-formes qui offrent ces technologies.
C'est-à-dire?
Les entreprises de big tech qui produisent ces modèles auraient moyen de rendre les interactions plus sûres. La responsabilité principale se trouve du côté des prestataires de services. Il est possible de réaliser des audits techniques, par exemple, en testant les réponses d'une intelligence artificielle dans tous les sens jusqu'à s'assurer que le risque qu'elle donne des informations dangereuses soit considérablement limité. Cette technique porte le nom de «red teaming» dans le milieu de la cybersécurité. Il y en a d'autres, qui sont répandues et connues.
Alors, pourquoi ça ne se fait pas?
Cela demande des ressources, du temps, il faut parfois changer la gouvernance de l'entreprise et accepter des contrôles externes. Ce n'est pas juste une question d'ingénierie informatique, il s'agit de choix et de coûts très concrets. Ce n'est donc pas dans leurs intérêts, surtout si les autres compétiteurs ne le font pas.
Quelles peuvent être les conséquences pratiques d'une telle situation?
L'année dernière, un adolescent s'est suicidé aux Etats-Unis, en s'aidant des conseils de ChatGPT, qui a même validé et encouragé sa démarche désespérée.
Et la société OpenAI, derrière ChatGPT, a été poursuivie par les parents.
Les hallucinations peuvent-elles être causées volontairement?
Oui, mais dans ce genre de cas, il s'agit bien souvent de tentatives de désinformation. Les réseaux de propagande pro-russes en ont fait leur spécialité: en laissant dans la nature des fausses informations, ils donnent à manger à ces modèles les informations qui les arrangent. L'IA ne faisant pas la distinction entre le vrai et le faux — une logique humaine, je le rappelle — elle va recracher des informations fausses. Cela s'appelle du «LLM poisoning», de l'empoisonnement à base de LLM. On connaît des cas où il a suffi de créer environ 250 faux sites web pour arriver à faire changer la réponse d'une IA.
Faut-il, alors, se méfier de tout ce que ChatGPT, Gemini ou Claude nous disent?
Je ne suis pas sûre. Déjà, dans de nombreux cas, des réponses plausibles sont suffisantes pour l'usage qui en est fait...
Je me méfie plutôt d'un discours d'«inévitabilité», qu'on voit arriver à chaque nouvelle technologie. On le voit dans le monde du travail, avec la pression qui monte pour les utiliser sans se poser de questions pour raisons de productivité, avec un pouvoir économique en embuscade. De même, au niveau privé, on peut se passer d'une technologie ou décider de ne l'utiliser que dans un contexte donné ou un cas concret.
