Une IA open source chinoise qui rivalise avec ChatGPT

L’intelligence artificielle (IA) continue d’évoluer à une vitesse vertigineuse, mais cette fois, ce n’est pas une entreprise américaine qui fait la une des journaux. DeepSeek, une société chinoise, vient de présenter Recherche profonde V3un modèle d’IA qui entend concurrencer les chatbots américains comme ChatGPT, Claude, Copilot et Gemini. Voici tout ce que vous devez savoir sur DeepSeek, cette actualité intelligence artificielle générative ce qui pourrait bien bousculer le secteur.

DeepSeek, une IA prometteuse et accessible

Fondée en 2023, l’entreprise chinoise Recherche profonde n’a pas perdu de temps pour marquer son territoire dans le domaine de l’intelligence artificielle. En moins d’un an, elle a conçu plusieurs modèles d’IA puissants, dont DeepSeek V3, son dernier né, lancé le 26 décembre 2024. Selon la Chine, ce modèle serait capable de rivaliser, voire de surpasser, des benchmarks comme le GPT. -4o d’OpenAI ou Claude-3.5 Sonnet d’Anthropic. Juste ça !

Mais ce qui fait vraiment la différence pour DeepSeek V3 par rapport aux autres ténors américains, c’est son caractère. source ouverte et son coût de développement exceptionnellement faible : 5,5 millions de dollars, une somme bien inférieure à celle investie par d’autres entreprises du secteur pour des modèles similaires.

Avec son 671 milliards de paramètresDeepSeek V3 se positionne comme l’un des modèles open source les plus puissants disponibles aujourd’hui. Il excelle particulièrement dans des domaines tels que le codage, les mathématiques et la génération de textes.

En plus de sa polyvalence, DeepSeek V3 est incroyablement rapide : capable de traiter jusqu’à 60 mots par secondeil surpasse le modèle précédent, DeepSeek V2, trois fois plus rapidement. Cette efficacité, combinée à une architecture avancée et à un entraînement massif basé sur 14,8 billions de jetonsgarantirait des réponses précises et variées. A voir en réalité, mais cela reste très prometteur…

Des performances plus qu’honorables

DeepSeek V3 n’est pas seulement un modèle open source ambitieux, il affiche également des performances qui rivalisent avec les meilleurs modèles fermés, selon les benchmarks partagés par l’entreprise chinoise.

Compréhension des connaissances : Avec un score de 75,9% sur MMLU-Pro (EM)DeepSeek V3 surpasse GPT-4o (72,6%) et se rapproche des meilleurs modèles comme Claude-3.5.
Mathématiques avancées : Son score de 90,2 % sur MATH-500 (EM) le place en tête face à des concurrents comme Llama 3.1 (73,8%), Claude-3.5 (78,3%) et GPT-4o (74,6%).
Programmation : Sur Forces de codeil atteint 51,6%se positionnant bien au-dessus des autres modèles fermés.
Tâches complexes : Avec 59,1% sur GPQA-DiamantDeepSeek V3 prouve son efficacité en se plaçant devant tout le monde, à l’exception de Claude.

Ces résultats montrent clairement que DeepSeek V3 n’a rien à envier à ses concurrents fermés et qu’il s’impose même comme un modèle polyvalent et puissant, notamment pour les développeurs.

Limites à prendre en compte

Malgré ses nombreuses qualités, DeepSeek V3 présente quelques inconvénients. Sa taille imposante nécessite une infrastructure technique robuste pour fonctionner de manière optimale. De plus, le modèle est soumis aux réglementations du gouvernement chinois, ce qui signifie que certains sujets sensibles peuvent être évités ou modérés.

Cependant, son coût d’utilisation via API reste compétitif (0,14$/million de tokens en entrée et 0,28$/million en sortie jusqu’au 08/02/2025), ce qui en fait une alternative sérieuse pour ceux qui recherchent une solution performante et économique.

Pour utiliser DeepSeek V3, plusieurs options s’offrent à vous :

Conclusion : Une IA à suivre de près

Avec DeepSeek V3, la Chine s’impose désormais comme un acteur majeur de l’IA générative open source. Ce modèle allie puissance, performances et accessibilité, offrant une alternative sérieuse aux solutions fermées. Alors bien sûr, tout n’est pas parfait : sa taille et les restrictions liées à son origine chinoise pourraient en freiner certains, mais malgré tout, ce modèle d’IA mérite de garder un œil sur lui.

Source : Recherche profonde