Principaux renseignements
- L’efficacité du développement de l’IA de DeepSeek a suscité un débat au sein de l’industrie.
- High-Flyer Quant, la société mère de DeepSeek, a constitué une infrastructure informatique importante avec des dépenses potentielles en matériel dépassant les 500 millions de dollars.
- Les innovations logicielles sont indéniables et les performances ne dépendent pas uniquement des investissements en matériel.
L’efficacité du développement de l’IA de DeepSeek a suscité un débat au sein de l’industrie. Alors que la start-up chinoise affirme que son modèle de langage large DeepSeek-V3 a été entraîné en utilisant seulement 2,8 millions d’heures de GPU (Unité de Traitement Graphique) pour un coût de 5,6 millions de dollars, ce chiffre contraste fortement avec les milliards dépensés par les géants technologiques américains pour des projets similaires.
Spéculations
Le succès de DeepSeek a alimenté les spéculations sur l’ampleur réelle de leur investissement. En effet, des documents montrent que sa société mère, le fonds spéculatif High-Flyer Quant, a accumulé une grande infrastructure informatique. Dès 2019, Liang Wenfeng, fondateur de High-Flyer et de DeepSeek, a investi massivement dans des processeurs graphiques pour le trading algorithmique. De plus, le site de High-Flyer met en avant le développement de Fire-Flyer 2, un cluster de supercalculateurs atteignant 1 550 pétaflops. (Une unité qui mesure la vitesse de traitement d’un ordinateur, équivalente à 1 quadrillion de calculs par seconde.) Cela le rend comparable à certains des supercalculateurs les plus puissants au monde.
Dépenses potentielles de serveur
Les analystes de SemiAnalysis estiment que les dépenses en matériel de DeepSeek dépassent les 500 millions de dollars. Cela inclut les coûts de recherche et développement ainsi que les dépenses totales de propriété. Leurs projections suggèrent même des dépenses potentielles de 1,6 milliard de dollars pour les serveurs. Parmi cela, 944 millions de dollars concernent les coûts d’exploitation liés aux clusters de calcul.
Élément déterminant
Malgré les chiffres divergents sur les dépenses de DeepSeek, ses innovations logicielles sont incontestables. En effet, les modèles de l’entreprise montrent que la performance ne dépend pas uniquement des investissements matériels. De plus, les analystes de Morgan Stanley reconnaissent ce point. Ils affirment ainsi que la production de DeepSeek change la donne en soutenant les applications d’IA. Par ailleurs, l’analyste Tilly Zhang de Gavekal note que la course à la tête en IA ne dépend plus seulement des puces avancées. En réalité, elle requiert aussi la capacité de les utiliser efficacement.
Si vous souhaitez accéder à tous les articles, abonnez-vous ici!