Principaux renseignements
- Anthropic a lancé Claude Fable 5, doté de capacités supérieures en matière de programmation et de vision.
- Anthropic lance ainsi une première version dérivée du très puissant modèle Mythos.
- Des protocoles de sécurité rigoureux redirigent les requêtes à haut risque afin d’empêcher toute utilisation abusive dans des domaines sensibles.
Anthropic a lancé Claude Fable 5, permettant pour la première fois au grand public d’utiliser une technologie dérivée de son modèle Mythos ultra-puissant. Bien que ce modèle fasse preuve de capacités supérieures en vision, en travail intellectuel spécialisé et en développement logiciel, il est accompagné de protocoles de sécurité rigoureux.
Afin d’empêcher toute utilisation abusive dans des domaines sensibles tels que la chimie, la biologie et la cybersécurité, le système est programmé pour refuser les requêtes à haut risque et rediriger les utilisateurs vers Claude Opus 4.8.
Déploiement progressif
Le déploiement suit une trajectoire prudente. Mythos a d’abord été présenté en avant-première en avril à un petit groupe de partenaires, puis étendu à plusieurs centaines d’organisations axées sur les infrastructures à travers le monde. Actuellement, Fable 5 est accessible via des forfaits Enterprise basés sur la consommation et l’API Claude. Pour les abonnés aux formules Pro, Max, Team et Enterprise basées sur le nombre de postes, le modèle est gratuit jusqu’au 22 juin.
À partir du 23 juin, les utilisateurs de ces formules devront utiliser des crédits pour accéder à Fable 5 jusqu’à ce que l’entreprise puisse le réintégrer en tant que fonctionnalité standard de l’abonnement. Parallèlement, une version mise à jour, baptisée Mythos 5, est en cours de distribution auprès des organisations précédemment autorisées.
Gérer les risques liés à l’IA de pointe
Cette publication intervient alors qu’Anthropic se prépare à une éventuelle introduction en bourse et plaide en faveur d’un mécanisme mondial et synchronisé visant à ralentir le développement de l’IA de pointe. La société a exprimé ses inquiétudes concernant l’auto-amélioration récursive (RSI), un phénomène par lequel les systèmes d’IA pourraient évoluer indépendamment de toute supervision humaine. Afin d’atténuer ces risques, Anthropic a soumis Fable 5 à des programmes rigoureux de red teaming et de bug bounty, qui n’ont pas permis de découvrir de failles universelles au cours de plus de 1 000 heures de tests.
Malgré ces mesures de sécurité, la possibilité de nouvelles failles a conduit Anthropic à mettre en place une politique obligatoire de conservation des données pendant 30 jours pour l’ensemble du trafic, remplaçant ainsi tout contrat antérieur prévoyant une conservation nulle. L’entreprise précise que ces données ne seront pas utilisées à des fins d’entraînement, mais qu’elles sont nécessaires pour affiner les classificateurs et contrer les attaques complexes. Cette initiative pourrait établir une nouvelle tendance dans le secteur, où l’accès à des modèles d’élite nécessiterait d’accepter un stockage obligatoire des données à des fins de sécurité.
Des performances impressionnantes
Les indicateurs de performance de Fable 5 sont impressionnants. Selon le cabinet d’analyse Hex, ce modèle est le premier à atteindre un score de 90 pour cent lors d’un test de performance pour des tâches analytiques à long terme, faisant preuve d’un haut niveau de nuance.
D’autres acteurs du secteur, tels que Genspark et Base44, ont salué sa capacité à créer des applications complètes en une seule tentative ainsi que sa supériorité en matière de codage de jeux et de conception d’interface utilisateur. Si la plupart des sessions (environ 95 pour cent) restent dans le cadre de Fable 5 sans revenir à Opus 4.8, le coût est considérable.
Plus cher
À 10 dollars par million de jetons d’entrée et 50 dollars par million de jetons de sortie, Fable 5 est deux fois plus cher qu’Opus 4.8. Étant donné que de nombreuses entreprises sont déjà confrontées à une escalade des dépenses en IA, ce prix pourrait limiter son adoption. Cependant, certaines entreprises, telles que Rakuten, affirment que la capacité du modèle à s’auto-valider et à réfléchir sur son travail justifie le coût en permettant un niveau plus élevé d’autonomie opérationnelle.
Suivez également Business AM sur Google Actualités
Si vous souhaitez accéder à tous les articles, abonnez-vous ici !

