DeepSeek a mis au point un modèle d’IA performant qui, lors de tests indépendants, a surpassé les systèmes leaders conçus dans la Silicon Valley. Selon Venture Beat et d’autres sources, l’entreprise a réussi cet exploit en seulement deux mois et avec un budget inférieur à 6 millions de dollars — soit environ un dixième des sommes dépensées par des géants comme Meta pour des projets similaires.
Baptisé R1, le nouveau modèle brille dans des tâches complexes telles que la résolution de problèmes, les calculs mathématiques et la programmation. Il surpasse des systèmes renommés comme Llama 3.1 de Meta, GPT-4o d’OpenAI, ou encore Claude Sonnet 3.5 d’Anthropic. Satya Nadella, PDG de Microsoft, a exprimé son admiration lors du Forum économique mondial de Davos:
Ce qui rend DeepSeek unique, c’est que l’entreprise propose son programme en open source, gratuitement. Contrairement aux systèmes fermés d’OpenAI ou de Google, accessibles uniquement via des interfaces payantes, DeepSeek permet à d’autres entreprises de consulter, utiliser et modifier librement son système.
Ce succès est d’autant plus remarquable que DeepSeek opère malgré les restrictions commerciales imposées par les États-Unis, qui interdisent la vente de leurs meilleurs processeurs à la Chine. Des experts estiment que la start-up a soit développé des méthodes d’entraînement plus efficaces, soit trouvé un moyen de contourner ces restrictions.
Les systèmes de DeepSeek ne sont pas exempts de critiques. En tant qu’entreprise chinoise, elle est soumise aux lois de censure du pays. Par exemple, son programme est incapable de répondre à des questions sur des sujets politiques sensibles. Toutefois, les partisans de l’approche open source avancent que cette nature ouverte pourrait permettre de contourner de telles limitations.
Les Etats-Unis, préoccupés par leur position de leader en intelligence artificielle, surveillent de près cette évolution. En réponse, le gouvernement américain prévoit, avec la collaboration d’OpenAI, d’investir 500 milliards de dollars au cours des quatre prochaines années pour développer de nouveaux systèmes d’IA.
mho / t-online
Traduit de l'allemand