Principaux renseignements
- Les principaux fournisseurs de services cloud rencontrent des problèmes de surchauffe avec les derniers racks « Blackwell » de NVIDIA.
- Des commandes d’une valeur de plus de 10 milliards de dollars sont retardées ou annulées en raison de ces problèmes.
- Les clients envisagent des solutions alternatives, telles que l’utilisation de puces NVIDIA AI plus anciennes.
Les principaux fournisseurs de services cloud ajustent leurs commandes de racks « Blackwell » de NVIDIA en raison de problèmes de surchauffe signalés. Des sources indiquent que les premiers déploiements de ces racks ont connu des problèmes de connectivité entre les puces et une production de chaleur excessive.
Certains de ces grands clients, dont Microsoft, Amazon, Google et Meta, avaient passé des commandes pour des baies Blackwell d’une valeur totale de plus de 10 milliards de dollars. En réponse à ces problèmes, certains clients choisissent de reporter leurs achats et d’attendre une version mise à jour des racks ou envisagent des solutions alternatives comme l’utilisation de puces NVIDIA AI plus anciennes.
Impact sur les partenariats commerciaux
Le plan initial de Microsoft prévoyait d’intégrer des baies GB200 équipées d’au moins 50 000 puces Blackwell dans l’une de ses installations de Phoenix. Cependant, des rapports suggèrent qu’OpenAI a demandé à Microsoft de fournir une génération précédente de puces « Hopper » de NVIDIA en raison des retards liés au déploiement des racks Blackwell.
Ce n’est pas la première fois que NVIDIA rencontre des problèmes avec ses GPU Blackwell. Des rapports antérieurs ont mis en évidence des problèmes de surchauffe dans les serveurs abritant 72 processeurs, ce qui a entraîné de multiples révisions de la conception des racks de serveurs par NVIDIA.
Si vous souhaitez accéder à tous les articles, abonnez-vous ici!