Deepseek est étonnamment rentable, le modèle d'IA défie les géants de l'industrie. Le coût de formation autoproclamé de 6 millions de dollars de l'entreprise pour Deepseek V3, utilisant seulement 2048 GPU, semblait initialement révolutionnaire. Cependant, un examen plus approfondi révèle un investissement beaucoup plus important.
Image: esigame.com
Deepseek V3 exploite les technologies innovantes: Prédiction multi-token (MTP) pour une précision et une efficacité améliorées; Mélange d'experts (MOE) , en utilisant 256 réseaux neuronaux (huit activés par jeton); et Attention latente multi-tête (MLA) pour une amélioration de l'extraction d'informations. Ces progrès contribuent aux performances concurrentielles du modèle.
Image: esigame.com
Contrairement aux allégations initiales, la semianalyse a révélé l'utilisation par Deepseek d'environ 50 000 GPU NVIDIA, y compris les unités H800, H100 et H20 H20, réparties sur plusieurs centres de données. Cette infrastructure représente un investissement substantiel d'environ 1,6 milliard de dollars, avec des dépenses opérationnelles estimées à 944 millions de dollars.
Image: esigame.com
Deepseek, une filiale de High Flyer, possède ses centres de données, fournissant le contrôle et accélérer l'innovation. Sa nature autofinancée favorise l'agilité. Les salaires élevés, dépassant 1,3 million de dollars par an pour certains chercheurs, attirent les meilleurs talents des universités chinoises.
Le chiffre de 6 millions de dollars ne reflète que les coûts GPU avant la formation, l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures. L'investissement total total de l'IA de Deepseek dépasse 500 millions de dollars. Malgré cela, sa structure rationalisée permet une innovation efficace.
Image: esigame.com
Alors que le succès de Deepseek présente le potentiel des sociétés d'IA indépendantes bien financées, le récit "favorable à un budget" est trompeur. Des milliards d'investissements, des percées technologiques et une équipe qualifiée sont des facteurs clés. Cependant, même avec ces ressources substantielles, les coûts de Deepseek restent nettement inférieurs à ceux des concurrents, tels que les 100 millions de dollars dépensés signalés pour ChatGpt4O par rapport aux 5 millions de dollars de Deepseek pour R1. La disparité met en évidence l'efficacité relative de Deepseek, malgré l'investissement global significatif.