Chez Anthropic, l’intelligence artificielle prend en charge 80 pour cent du travail de programmation


Principaux renseignements

  • Claude génère désormais plus de 80 pour cent du code de production d’Anthropic.
  • Les agents IA autonomes obtiennent de meilleurs résultats que les humains dans les tâches complexes de recherche et d’exécution.
  • Des accords internationaux doivent réguler le développement de l’IA afin d’éviter une auto-amélioration récursive incontrôlable.

Anthropic a publié un article de recherche intitulé « When AI builds itself » (Quand l’IA se construit elle-même), soulignant un changement radical dans le développement logiciel. En mai 2026, Claude était responsable de la création de plus de 80 pour cent du code présent dans les systèmes de production de l’entreprise. Il s’agit d’un bond en avant considérable par rapport aux quantités négligeables enregistrées lors du lancement de Claude Code début 2025. Certains ingénieurs de l’entreprise ont complètement abandonné le codage manuel et s’en remettent désormais à l’IA pour effectuer leur travail.

Gains exponentiels en matière de productivité technique

Les gains d’efficacité rapportés sont significatifs. Au cours du deuxième trimestre 2026, les ingénieurs ont fusionné huit fois plus de code par jour qu’en 2024. De plus, les employés utilisant le modèle Mythos Preview ont estimé que leur productivité avait quadruplé. La capacité de Claude à relever des défis techniques complexes s’est également améliorée rapidement, son taux de réussite ayant bondi de 50 points de pourcentage en seulement six mois. Dans un cas précis, l’IA a résolu une panne critique du système en deux heures, une tâche qui nécessite généralement plusieurs jours de travail humain.

Combler le fossé de qualité

La qualité du code généré par l’IA atteint également un tournant. Alors qu’elle était auparavant considérée comme inférieure au travail humain, elle est désormais jugée à peu près équivalente, et les experts s’attendent à ce qu’elle dépasse la qualité humaine d’ici un an. Afin de maintenir les normes, un évaluateur automatisé basé sur Claude vérifie toutes les modifications du code. L’analyse montre que ce système aurait permis d’éviter un tiers des erreurs de production antérieures.

Évolution vers la recherche autonome

Au-delà du simple codage, Anthropic cherche à déterminer si l’IA est capable de mener des recherches scientifiques originales. Dans le cadre d’une expérience menée en 2026, un groupe de neuf agents IA autonomes a collaboré à un projet de recherche en matière de sécurité. Après 800 heures de fonctionnement, ils ont comblé 97 pour cent de l’écart de performance sur cette mission, surpassant largement deux chercheurs humains qui n’avaient comblé que 23 pour cent de cet écart en une semaine. De plus, la capacité de Claude à déterminer la « prochaine étape » correcte dans une séquence de recherche est passée de 51 pour cent fin 2025 à 64 pour cent en avril 2026.

Exécution autonome plus rapide

Les données de l’organisation à but non lucratif METR indiquent que la durée des tâches que l’IA peut gérer de manière autonome s’accélère. La fenêtre temporelle permettant une exécution fiable de l’IA a doublé environ tous les quatre mois. Alors que Claude Opus 3 ne pouvait gérer que des tâches de quatre minutes début 2024, la version actuelle Mythos Preview peut maintenir sa productivité pendant au moins 16 heures. Cela suggère que les tâches nécessitant des jours, voire des semaines, de travail humain spécialisé pourraient être automatisées d’ici 2027.

Pression sur les infrastructures

Cette forte augmentation de l’activité liée à l’IA met les infrastructures numériques à rude épreuve. GitHub a enregistré un pic d’activité considérable, passant de 1 milliard de commits par an en 2025 à 14 milliards prévus en 2026. Claude Code contribue chaque semaine à des millions de commits. En interne, Anthropic a constaté que la révision humaine est devenue le principal goulot d’étranglement, illustrant ainsi la loi d’Amdahl : à mesure que la vitesse de génération de code augmente, la partie la plus lente restante du processus devient le facteur limitant.

Appel à une surveillance mondiale

L’appel le plus pressant formulé dans le document concerne la mise en place d’un mécanisme de « frein » coordonné à l’échelle mondiale. Anthropic affirme qu’une pause unilatérale décrétée par une seule entreprise n’est pas efficace ; l’entreprise propose plutôt un accord international vérifiable entre les laboratoires et les pays visant à suspendre le développement dans des circonstances spécifiques. Tout en comparant cette situation au contrôle des armes nucléaires, l’entreprise reconnaît que l’entraînement de l’IA est plus difficile à contrôler que les armes physiques et que l’incitation financière à ignorer une telle pause est énorme.

Anthropic esquisse trois scénarios possibles pour l’avenir. Le premier est un plateau de développement qui continue de bouleverser l’économie. Le deuxième est un avenir dans lequel l’IA automatise la majeure partie du développement, mais où les humains continuent de diriger la vision, permettant ainsi à de petites équipes de rivaliser avec de grandes entreprises. Le troisième est l’auto-amélioration récursive, dans laquelle l’IA conçoit ses propres successeurs. L’entreprise admet que les implications du troisième scénario sont imprévisibles. Des obstacles biologiques et sociaux, tels que les essais cliniques et les processus politiques, continueront de limiter la vitesse globale du changement social.

Suivez également Business AM sur Google Actualités

Si vous souhaitez accéder à tous les articles, abonnez-vous ici !

Ajoutez fr.businessam.be en tant que source préférée sur Google
Plus