Principaux renseignements
- OpenAI et Broadcom ont lancé « Jalapeño », une puce qui optimise la vitesse et les coûts de l’inférence des modèles de langage à grande échelle (LLM).
- L’architecture matérielle sur mesure optimise l’efficacité énergétique en réduisant au minimum les transferts de données.
- Les modèles d’IA ont permis d’accélérer le cycle de conception de la puce, qui a ainsi pu entrer en production en neuf mois.
OpenAI et Broadcom ont présenté « Jalapeño », un processeur spécialisé qui optimise l’inférence des grands modèles linguistiques (LLM). La puce marque le lancement d’une stratégie matérielle à long terme et multigénérationnelle visant à améliorer la vitesse, la fiabilité et l’accessibilité financière de l’intelligence artificielle avancée.
Ce projet est le fruit d’une collaboration entre l’expertise de Broadcom en matière de semi-conducteurs et de réseaux et les capacités d’intégration de systèmes et de production de Celestica.
Optimisation de la consommation d’énergie
Contrairement aux accélérateurs à usage général, Jalapeño a été entièrement conçu à partir de zéro sur la base des données internes d’OpenAI concernant les noyaux de modèles, les systèmes de service et les besoins en mémoire. L’architecture est conçue pour minimiser les transferts de données et équilibrer les ressources réseau et de calcul, permettant ainsi au matériel de fonctionner à un niveau proche de ses performances maximales théoriques.
Bien que les résultats définitifs des tests de performance ne soient pas encore disponibles, les essais préliminaires indiquent que la puce offre un rendement énergétique nettement supérieur aux normes actuelles du secteur. Le matériel est déjà testé en laboratoire avec des charges de travail complexes, notamment GPT-5.3-Codex-Spark.
Contrôle total de la pile technique
Cette initiative est au cœur de l’objectif d’OpenAI visant à contrôler l’ensemble de sa pile technique. En concevant l’infrastructure sous-jacente – depuis les puces et les systèmes de mémoire jusqu’aux couches de planification et de déploiement – , l’entreprise peut s’assurer que chaque composant est optimisé pour une efficacité maximale.
Greg Brockman, président d’OpenAI, a souligné que cette stratégie vise à rendre les ressources de calcul plus abondantes, réduisant ainsi les coûts pour les entreprises et les particuliers tout en résolvant des problèmes mondiaux plus complexes.
Développement
Le processus de développement de Jalapeño a été remarquablement rapide, passant du concept initial à la finalisation du circuit intégré en seulement neuf mois. Cette prouesse a été rendue possible grâce à une intégration étroite entre le logiciel et le matériel, ainsi qu’à l’utilisation non conventionnelle des propres modèles d’OpenAI pour accélérer la phase de conception et d’optimisation de la puce.
Cela crée un cycle auto-renforçant dans lequel l’IA est utilisée pour construire l’infrastructure même qui alimentera les futures versions, plus performantes, de cette technologie.
Extension à grande échelle de l’infrastructure d’IA
À l’avenir, la puce constituera la première phase d’une plateforme matérielle plus vaste. En partenariat avec Microsoft et d’autres acteurs, OpenAI et Broadcom prévoient de déployer des centres de données à l’échelle du gigawatt à partir de 2026.
L’objectif ultime est de démocratiser l’IA en réduisant le coût et la latence de l’inférence, garantissant ainsi que des outils tels que ChatGPT et l’API OpenAI soient plus rapides et plus accessibles à un public mondial de chercheurs, d’étudiants et d’entrepreneurs.
(at)
Suivez également Business AM sur Google Actualités
Si vous souhaitez accéder à tous les articles, abonnez-vous ici !

