Cybersécurité, biologie: pourquoi Anthropic limite son modèle le plus puissant
Anthropic, éditrice des modèles d'intelligence artificielle (IA) Claude, a mis mardi à la disposition du grand public la version la plus puissante de sa technologie. Toutefois, l'entreprise l'a bridé dans des domaines sensibles comme la cybersécurité et, fait nouveau, les risques d'attaque biologique ou chimique.
Baptisé Fable 5, ce modèle est le premier de la classe Mythos, la gamme la plus avancée d'Anthropic, dévoilée en avril mais restreinte pour des raisons de sécurité, à être ouvert au public.
En parallèle, Anthropic propose une version non bridée, Claude Mythos 5, aux entreprises, organisations et agences étatiques disposant déjà d'un accès à cette famille de modèles, présentée comme capable de détecter et exploiter des failles de sécurité à une vitesse et avec une acuité inédites.
Début avril, Anthropic avait annoncé simultanément l'existence de Mythos et sa décision d'en limiter l'accès à des partenaires de confiance pour renforcer leur protection cyber.
La nouvelle lui avait valu des accusations de «marketing de la peur» et provoqué dans le même temps une visible agitation au sommet des Etats et des institutions mondiales, pour évaluer l'état de la menace sur des infrastructures essentielles (bancaires, énergétiques, etc).
Depuis, plusieurs entreprises ayant eu accès à Mythos ont confirmé ses capacités, et le gouvernement américain, pourtant en contentieux avec Anthropic, a fini par le tester.
La Maison-Blanche a depuis instauré un dispositif d'évaluation facultatif des modèles d'IA américains les plus puissants, avant leur commercialisation. OpenAI, le rival d'Anthropic, est sur le point de dévoiler la version 5.6 de son ChatGPT.
Attaques biologiques?
Jusqu'ici, Anthropic justifiait de restreindre l'accès à Mythos uniquement pour les risques de cybersécurité. Avec Fable 5, Anthropic étend donc la vigilance et le contrôle aux risques d'attaques biologiques et chimiques. Le laboratoire cite l'exemple de la conception de virus adéno-associés (AAV), potentiellement dangereux, mais aussi bénéfique en thérapie génique. C'est pourquoi la version non bridée sera ouverte à des chercheurs en biologie sélectionnés, précise l'entreprise.
Selon elle, la plupart des requêtes concernant la cybersécurité ou la biologie reçoivent une réponse du modèle inférieur, Opus 4.8, rendu public fin mai.
Anthropic présente Fable 5 comme la version sécurisée de Mythos qui, sans garde-fous, ne pourrait être ouvert au public. Ce cadre repose sur des filtres automatiques qui analysent les requêtes en temps réel et bloquent celles sensibles
Anthropic affirme avoir chargé des experts extérieurs de chercher à les déjouer, une démarche de simulation d'attaque, le «red teaming», en rémunérant ceux qui y parvenaient. (mbr/ats)
