Deepseek est étonnamment bon marché, le modèle d'IA défie les géants de l'industrie. La startup chinoise prétend avoir formé son puissant réseau de neurones Deepseek V3 pour seulement 6 millions de dollars, utilisant seulement 2048 GPU, un contraste frappant avec les coûts nettement plus élevés des concurrents. Cette figure apparemment faible, cependant, ne reflète que l'utilisation des GPU avant la formation et exclut les dépenses de recherche, de raffinement, de traitement des données et d'infrastructure substantielles.
Image: esigame.com
L'architecture innovante de Deepseek V3 contribue à son efficacité. Les technologies clés incluent la prédiction multi-token (MTP), qui prévoit plusieurs mots simultanément; Mélange d'experts (MOE), employant 256 réseaux de neurones pour une formation accélérée; et l'attention latente multi-tête (MLA), en se concentrant sur des éléments de phrase cruciaux pour une meilleure précision.
Image: esigame.com
Cependant, un examen plus approfondi révèle un investissement substantiel. La semianalyse a découvert l'utilisation par Deepseek d'environ 50 000 GPU Nvidia Hopper, évalués à environ 1,6 milliard de dollars, avec des coûts opérationnels atteignant 944 millions de dollars. Cela contredit la réclamation initiale de 6 millions de dollars.
Image: esigame.com
Le succès de Deepseek découle d'une combinaison de facteurs: financement substantiel (plus de 500 millions de dollars investis dans le développement de l'IA), des progrès technologiques et une équipe hautement qualifiée gagnant des salaires substantiels (certains dépassant 1,3 million de dollars par an). La structure indépendante de la société et la propriété de ses centres de données contribuent à son agilité et à son efficacité.
Image: esigame.com
Alors que le récit "adapté au budget" de Deepseek est sans doute gonflé, sa réussite reste importante. La société démontre qu'une entité d'IA indépendante bien financée peut être efficacement concurrentielle avec les acteurs établis, malgré l'investissement substantiel requis. Le contraste est frappant lors de la comparaison des coûts de formation: le R1 de Deepseek coûte 5 millions de dollars, tandis que ChatGPT4 a coûté 100 millions de dollars. Malgré le coût réel plus élevé, le modèle de Deepseek reste relativement moins cher que ses concurrents.