DeepSeek-V3.2-Exp : Un nouveau modèle d’IA rivalise avec ChatGPT, mais est plus rentable


Principaux renseignements

  • DeepSeek-V3.2-Exp améliore son prédécesseur avec une efficacité accrue et une réduction des coûts.
  • Le modèle DeepSeek utilise la technologie DSA (DeepSeek Sparse Attention) pour optimiser le traitement des textes pour les longs documents et les conversations.
  • DeepSeek se concentre sur l’adaptation de modèles aux puces IA développées par la Chine. Cette décision s’inscrit dans l’objectif de la Chine de réduire sa dépendance vis-à-vis des fabricants de puces étrangers.

DeepSeek, une entreprise chinoise spécialisée dans l’intelligence artificielle, a dévoilé un nouveau modèle expérimental d’IA appelé DeepSeek-V3.2-Exp. Ce modèle s’appuie sur son prédécesseur, DeepSeek-V3.1-Terminus, en mettant l’accent sur l’amélioration de l’efficacité et la réduction des coûts.

DeepSeek a attiré l’attention au début de l’année avec le lancement de son chatbot R1, qui, selon l’entreprise, rivalisait avec ChatGPT en termes de performances tout en étant plus rentable. Cependant, des inquiétudes concernant la sécurité nationale ont conduit à l’interdiction de l’utilisation de DeepSeek par les agences gouvernementales de plusieurs pays, dont l’Italie, les États-Unis et la Corée du Sud.

Efficacité accrue

DeepSeek-V3.2-Exp est conçu pour traiter de grandes quantités de données plus efficacement et à un coût nettement inférieur à celui de sa version précédente. La principale amélioration réside dans une nouvelle fonctionnalité appelée DSA (DeepSeek Sparse Attention). Cette technologie optimise la capacité du modèle à traiter de longs documents et conversations en réduisant les coûts de calcul associés à l’analyse de texte.

Bien que DeepSeek-V3.1-Terminus n’atteigne pas actuellement les performances des principaux modèles d’IA tels que ChatGPT, Grok ou Claude dans les tests de référence, il est comparable au modèle open-source d’OpenAI gpt-oss-120b selon Artificial Analysis.

L’accent mis sur les puces chinoises

L’engagement de DeepSeek à adapter ses modèles aux puces d’IA développées en Chine a attiré l’attention de l’industrie technologique. Cette démarche s’aligne sur les efforts déployés par la Chine pour réduire sa dépendance à l’égard des fabricants de puces étrangers et renforcer sa position dans la course mondiale à l’IA.

Les récentes restrictions américaines à l’exportation de puces Nvidia à haute performance vers la Chine ont alimenté cette tendance, soulignant l’importance du développement d’une infrastructure nationale d’IA.

Suivez également Business AM sur Google Actualités

Si vous souhaitez accéder à tous les articles, abonnez-vous ici!

Plus