On a testé l'IA qui secoue la tech et il s'est passé un drôle de truc

Un chatbot chinois a marqué un tournant dans le développement de l'intelligence artificielle. Nous l'avons testé DeepSeek et observé des choses étonnantes (et étranges).

Stephanie Schnydrig et Raffael Schuppisser / ch media

La start-up chinoise DeepSeek spécialisée dans l'intelligence artificielle (IA) pourrait bien révolutionner le secteur. Elle a récemment sorti R1, sorte d'équivalent chinois au ChatGPT américain d'OpenAI.

Le patron de celle-ci, Sam Altman, ne s'en est pas caché sur X: «C'est impressionnant de voir ce que R1 est capable de faire, surtout au vu du petit budget alloué à son développement».

Avant de tout de même souligner:

«Nous allons évidemment livrer des modèles encore bien meilleurs» Sam Altman

Et de se réjouir de l'émergence de nouveaux acteurs pour animer le marché.

Une concurrence bien vivante

En effet, R1 semble aussi puissant, voire plus, que ChatGPT. Mais avec des moyens nettement inférieurs: l'entraînement de l'IA aurait coûté environ 5,5 millions de dollars, alors que pour GPT-4, la barre des 100 millions a été franchie. Et alors que DeepSeek a eu besoin d'environ 2000 puces informatiques, il en a fallu huit fois davantage chez OpenAI.

Jürgen Schmidhuber a mené de nombreuses recherches sur les bases de l'intelligence artificielle en Suisse. Considéré comme une sommité dans son domaine, il travaille désormais en Arabie saoudite. Il voit d'un bon oeil les développements de modèles linguistiques aient lieu dans différents pays. «Cela stimule la concurrence et profitera de bien des manières à de nombreuses personnes, et pas seulement à quelques-unes».

La performance de DeepSeek ne surprend pas le spécialiste allemand. Elle révèle plutôt une tendance qui se poursuivra au fil des prochaines décennies: le développement et l'utilisation de l'IA deviendront toujours moins chers.

Jürgen Schmidhuber cadre:

«Un centre de calcul qui vaut 100 milliards aujourd'hui ne vaudra plus qu'un milliard dans dix ans. Bientôt, de petits ordinateurs bon marché équipés de logiciels open source de plus en plus efficaces feront ce que les grands centres de calcul font actuellement.»

L'IA ne sera plus contrôlée par quelques grandes entreprises. «Au contraire, chacun possédera une IA pas chère, mais performante et transparente, qui améliorera le quotidien à bien des égards».

Une chance pour la Suisse

Expert en chatbots et enseignant à la Haute école spécialisée du nord-ouest de la Suisse (FHNW), Andreas Martin se réjouit lui aussi qu'on puisse entraîner les logiciels avec nettement moins de puissance de calcul que ce que les entreprises américaines ont laissé croire jusqu'à présent. Ces dernières se sont en effet lancées dans une course aux investissements à hauteur de milliards de dollars pour l'infrastructure de l'IA.

«Mais ce n'est peut-être pas indispensable», estime le professeur. Une bonne nouvelle pour la Suisse et l'Europe:

«Nous pourrions développer nos propres modèles linguistiques, qui intégreraient nos valeurs européennes, le tout avec nettement moins de ressources que ce que nous estimions.»

R1 fait toutefois également l'objet de critiques, notamment en raison de la censure. Personne ne s'en cache: le chatbot formule ouvertement des réponses en accord avec les valeurs du Parti communiste.

Le modèle linguistique se corrige tout seul

On a donc testé l'outil et comparé sa réponse à celle de ChatGPT. A la question «Pourquoi Pékin a boycotté le dialogue avec la Suisse sur les droits humains?», R1 a vaguement répondu: «Il n'y a pas d'informations ou de rapports précis indiquant que la Chine a boycotté le dialogue à ce propos avec la Suisse». ChatGPT, en revanche, a fourni une réponse détaillée:

«Le dialogue bilatéral sur les droits humains entre la Suisse et la Chine a été suspendu par cette dernière en 2019 après que Berne a émis des critiques sur la situation en la matière en Chine.»

En réalité, c'est Pékin qui avait interrompu les discussions en 2019, elles ont repris en 2023. Il faut comprendre ce coup d'arrêt comme une réaction du régime au comportement de la Suisse, qui avait notamment exigé la fin de la répression des Ouïghours dans la région du Xinjiang.

On aimerait aussi savoir quelles sont les attractions qu'un touriste suisse devrait absolument voir dans l'Empire du Milieu. Ils citent tous deux la Grande Muraille, la Cité interdite ainsi que l'Armée de terre cuite. Le chatbot chinois recommande en outre une visite de la place Tian'anmen – l'endroit où le gouvernement a réprimé dans le sang un soulèvement populaire en 1989.

Lorsqu'on l'interroge sur les intérêts de ce lieu, DeepSeek mentionne – à notre grande surprise – la répression des insurgés. Mais il se produit alors quelque chose d'inattendu: la réponse s'efface soudainement juste après son apparition. Puis, on peut lire un autre message:

«Parlons donc d'autre chose»

Comment est-ce possible? Andreas Martin mentionne l'existence d'une «fonction de sécurité». Il peut s'agir de règles plus strictes ou même d'un deuxième modèle de langage qui contrôle les réponses comme un vigile et intervient pour les contenus délicats. Selon le spécialiste, presque toutes les IA basées sur un modèle linguistique incluraient ce type de mécanisme.

Biais également présent dans les modèles occidentaux

Il relève, cependant, que les versions occidentales ne sont pas non plus exemptes de coloration politique. De plus, explique Andreas Martin, elles tiennent compte des préjugés et des stéréotypes. Ainsi, les modèles de langage tels que ceux utilisés dans ChatGPT peuvent classer l'anglais afro-américain comme inférieur ou associer «secretary» plutôt au féminin, alors que «manager» rimera d'office avec le masculin.

Le professeur a effectué ses propres tests et a observé que des stéréotypes moins fréquents sur DeepSeek. Néanmoins, il s'agit toujours d'un problème grave et non résolu.

En tant que modèle de langage «ouvert», R1 présente par ailleurs l'avantage de pouvoir être téléchargé et entraîné avec les données de l'usager - gratuitement pour les particuliers, les organisations et les entreprises. Pour Jürgen Schmidhuber, DeepSeek dépasse aussi ChatGPT de par son code source ouvert, que toute personne disposant des compétences nécessaires peut vérifier et modifier. Un point pour les Chinois, en matière de transparence.

L'avantage du téléchargement: limiter le risque de fuite de données. Il en va autrement lors d'une utilisation via l'application ou un navigateur. On autorise alors DeepSeek à collecter des données personnelles et à les transmettre à des tiers - éventuellement aussi au gouvernement chinois.

Andreas Martin prévient:

«On ignore ce qu'il advient des données»

Toutefois, cela vaut également pour les entreprises américaines. Son conseil: ne jamais introduire d'éléments sensibles dans les agents conversationnels - quelle que soit leur «origine». «Au vu de la situation politique actuelle et de l'adoubement du monde de la tech par l'administration Trump, mieux vaut rester prudent avec ses données en général».

(Traduit de l'allemand par Valentine Zenker)