OpenAI et Broadcom présentent « Jalapeño » , une puce d’inférence d’IA - Business AM

Principaux renseignements

OpenAI et Broadcom ont lancé « Jalapeño », une puce qui optimise la vitesse et les coûts de l’inférence des modèles de langage à grande échelle (LLM).
L’architecture matérielle sur mesure optimise l’efficacité énergétique en réduisant au minimum les transferts de données.
Les modèles d’IA ont permis d’accélérer le cycle de conception de la puce, qui a ainsi pu entrer en production en neuf mois.

OpenAI et Broadcom ont présenté « Jalapeño », un processeur spécialisé qui optimise l’inférence des grands modèles linguistiques (LLM). La puce marque le lancement d’une stratégie matérielle à long terme et multigénérationnelle visant à améliorer la vitesse, la fiabilité et l’accessibilité financière de l’intelligence artificielle avancée.

Ce projet est le fruit d’une collaboration entre l’expertise de Broadcom en matière de semi-conducteurs et de réseaux et les capacités d’intégration de systèmes et de production de Celestica.

Optimisation de la consommation d’énergie

Contrairement aux accélérateurs à usage général, Jalapeño a été entièrement conçu à partir de zéro sur la base des données internes d’OpenAI concernant les noyaux de modèles, les systèmes de service et les besoins en mémoire. L’architecture est conçue pour minimiser les transferts de données et équilibrer les ressources réseau et de calcul, permettant ainsi au matériel de fonctionner à un niveau proche de ses performances maximales théoriques.

Bien que les résultats définitifs des tests de performance ne soient pas encore disponibles, les essais préliminaires indiquent que la puce offre un rendement énergétique nettement supérieur aux normes actuelles du secteur. Le matériel est déjà testé en laboratoire avec des charges de travail complexes, notamment GPT-5.3-Codex-Spark.

Contrôle total de la pile technique

Cette initiative est au cœur de l’objectif d’OpenAI visant à contrôler l’ensemble de sa pile technique. En concevant l’infrastructure sous-jacente – depuis les puces et les systèmes de mémoire jusqu’aux couches de planification et de déploiement – , l’entreprise peut s’assurer que chaque composant est optimisé pour une efficacité maximale.

Greg Brockman, président d’OpenAI, a souligné que cette stratégie vise à rendre les ressources de calcul plus abondantes, réduisant ainsi les coûts pour les entreprises et les particuliers tout en résolvant des problèmes mondiaux plus complexes.

Développement

Le processus de développement de Jalapeño a été remarquablement rapide, passant du concept initial à la finalisation du circuit intégré en seulement neuf mois. Cette prouesse a été rendue possible grâce à une intégration étroite entre le logiciel et le matériel, ainsi qu’à l’utilisation non conventionnelle des propres modèles d’OpenAI pour accélérer la phase de conception et d’optimisation de la puce.

Cela crée un cycle auto-renforçant dans lequel l’IA est utilisée pour construire l’infrastructure même qui alimentera les futures versions, plus performantes, de cette technologie.

Extension à grande échelle de l’infrastructure d’IA

À l’avenir, la puce constituera la première phase d’une plateforme matérielle plus vaste. En partenariat avec Microsoft et d’autres acteurs, OpenAI et Broadcom prévoient de déployer des centres de données à l’échelle du gigawatt à partir de 2026.

L’objectif ultime est de démocratiser l’IA en réduisant le coût et la latence de l’inférence, garantissant ainsi que des outils tels que ChatGPT et l’API OpenAI soient plus rapides et plus accessibles à un public mondial de chercheurs, d’étudiants et d’entrepreneurs.

(at)

Suivez également Business AM sur Google Actualités

Si vous souhaitez accéder à tous les articles, abonnez-vous ici !

OpenAI et Broadcom présentent « Jalapeño » , une puce d’inférence d’IA

Principaux renseignements

Optimisation de la consommation d’énergie

Contrôle total de la pile technique

Développement

Extension à grande échelle de l’infrastructure d’IA

OpenAI et Broadcom présentent « Jalapeño » , une puce d’inférence d’IA

La Chine reprend la tête du classement des supercalculateurs grâce au système LineShine

ByteDance cherche à obtenir un prêt de plusieurs milliards pour financer son expansion dans le domaine de l’IA et le développement de puces électroniques

Meta lance ses nouvelles lunettes connectées Meta Glasses, plus abordables, à partir de 309 euros

IBM et OpenAI collaborent à la mise au point d’une solution d’IA pour la sécurité des applications

Oracle supprime 21 000 emplois en un an dans le cadre d’une restructuration et de l’intégration de l’IA