#Anthropic发布Fable5模型 Un modèle, deux noms : Anthropic lance Fable 5 et Mythos 5, les modèles les plus puissants accessibles au public pour la première fois


9 juin, Anthropic a simultanément publié deux nouveaux modèles — Claude Fable 5 et Claude Mythos 5. Fait intéressant, ils sont en réalité basés sur le même modèle sous-jacent, la seule différence étant la "sécurité" renforcée. C’est la première fois que le modèle le plus performant d’Anthropic est disponible publiquement, et c’est aussi une expérience rare de "lancement par niveaux".
Cet article vous aidera à comprendre : ce qui le rend puissant, pourquoi il a deux noms, et comment l’utiliser dès maintenant.
1. Tout d’abord, clarifions : qu’est-ce qu’un modèle de niveau "Mythos" ?
Familiarisé avec Claude ? Les lecteurs savent que les modèles d’Anthropic sont toujours divisés en trois niveaux : Haiku (rapide), Sonnet ( équilibré), Opus (le plus puissant). En avril de cette année, Anthropic a discrètement introduit un nouveau niveau au-dessus d’Opus — le niveau Mythos. Le premier modèle de niveau Mythos (Claude Mythos Preview) n’a pas été vendu publiquement mais a été lancé via un projet appelé Project Glasswing, en coopération avec le gouvernement américain, et n’était accessible qu’à quelques agences de cybersécurité et fournisseurs d’infrastructures critiques.
La raison est simple : ce niveau de modèle est trop puissant, capable d’être mal utilisé dans des domaines comme les cyberattaques et la recherche biologique, donc Anthropic pense qu’il ne devrait pas être publié directement.
Les deux modèles publiés cette fois sont les versions officielles de niveau Mythos :
◆ Claude Fable 5 : une version accessible à tous avec une nouvelle série de garde-fous ;
◆ Claude Mythos 5 : une version avec certains garde-fous levés, uniquement disponible pour des partenaires de confiance comme Glasswing. Les deux sont basés sur le même modèle central. Les noms ont également été soigneusement choisis : Fable vient du latin fabula ("histoire racontée"), et partage ses racines avec le mythos grec — même origine — ne différant que par "la capacité à parler librement".
2. Quelle est sa puissance ?
Selon Anthropic, Fable 5 dépasse tous les modèles que la société a jamais publiés, et est à la pointe (SOTA) sur presque tous les benchmarks d’IA, excellant particulièrement en ingénierie logicielle, travail de connaissance, compréhension visuelle et recherche scientifique. Plus la tâche est longue et complexe, plus il devance les modèles plus anciens.
Codage : compresser deux mois en un jour. La société de paiement Stripe a rapporté lors de tests initiaux que Fable 5 a effectué une migration complète d’un code Ruby de 50 millions de lignes en un jour — ce qui prendrait normalement plus de deux mois de travail manuel par une équipe. Lors de l’évaluation Cognition (par Devin) FrontierCode, Fable 5 a obtenu le score le plus élevé parmi les modèles de pointe et utilisé moins de tokens.
Visuel : battre Pokémon FireRed sans assistance. Les modèles Claude précédents nécessitaient des outils auxiliaires complexes (cartes, navigation, infos sur l’état du jeu) pour progresser à peine dans Pokémon, mais Fable 5 a terminé le jeu simplement en regardant l’écran de jeu brut. Il peut aussi reconstruire le code source d’une application web directement à partir de captures d’écran.
Mémoire : prendre des notes en jouant à Slay the Spire. Dans des tâches avec des millions de tokens, Fable 5 peut maintenir sa concentration et améliorer ses performances en utilisant ses propres notes. Lors de tests avec le jeu de cartes Slay the Spire, après avoir été doté d’une mémoire persistante, ses performances ont triplé par rapport à Opus 4.8.
Recherche scientifique : accélérer la conception de médicaments d’environ 10 fois. Des experts en conception de protéines internes chez Anthropic ont utilisé Mythos 5 pour accélérer certaines étapes du développement de médicaments d’environ dix fois — les modèles ont réalisé de manière autonome des tâches telles que la sélection de sites de liaison, l’utilisation d’outils de conception de protéines, et la récupération après des échecs, sans assistance humaine. Sur 14 cibles protéiques, 9 ont abouti à des candidats médicaments prometteurs pour un développement ultérieur. Il a également proposé une nouvelle hypothèse mécanistique sur les protéines E. coli, confirmée par un laboratoire de recherche indépendant.
3. Comment fonctionne la sécurité : déclenchement d’un "downgrade" vers Opus 4.8
C’est l’aspect le plus intrigant du lancement. Fable 5 est équipé d’un nouvel ensemble de classificateurs — un système d’IA séparé du modèle principal — conçu pour détecter les utilisations potentielles abusives. Lorsque le classificateur détecte que votre demande concerne l’un des trois domaines sensibles suivants, la réponse ne proviendra plus de Fable 5 mais passera automatiquement à un modèle moins puissant, Claude Opus 4.8 (avec un message informant l’utilisateur) :
1. Cybersécurité : les modèles de niveau Mythos sont très capables de découvrir et d’exploiter des vulnérabilités logicielles, et peuvent effectuer des "piratages autonomes" — reconnaissance et mouvement latéral en un seul package. Ces capacités réduisent considérablement le coût des cyberattaques, d’où l’accent mis sur la défense.
2. Biologie et chimie : le modèle peut désormais effectuer des tâches scientifiques réelles (comme prédire l’assemblage de la capside virale). De telles capacités à double usage sont dangereuses entre de mauvaises mains, donc la plupart des demandes en biotechnologie sont rétrogradées vers Opus.
3. Attaques par distillation : empêcher l’extraction à grande échelle des capacités de Fable 5 pour entraîner des modèles concurrents.
Chiffres clés : le déclenchement de la garde se produit dans moins de 5 % des sessions, ce qui signifie que plus de 95 % des utilisateurs expérimentent presque toutes les capacités de Mythos 5. Anthropic admet que la garde est conservativement réglée et peut produire de faux positifs, et prévoit de réduire ces fausses alertes rapidement. Concernant les jailbreaks, plus de 1 000 heures de tests de vulnérabilités externes n’ont pas trouvé de "jailbreak universel".
Une autre modification notable : tout le trafic provenant des modèles de niveau Mythos sera conservé pendant 30 jours (y compris pour les clients d’entreprise) pour se défendre contre de nouvelles méthodes d’attaque et jailbreaks — Anthropic promet que ces données ne seront pas utilisées pour l’entraînement et qu’elles bénéficieront de protections de confidentialité telles que des audits d’accès.
4. Mythos 5 : une version "cercle de confiance" sans garde-fous
Mythos 5 est essentiellement Fable 5 avec certains garde-fous levés, revendiquant les capacités de cybersécurité les plus avancées au monde. Actuellement, il n’est disponible que via Project Glasswing pour les agences de cybersécurité, en tant que mise à niveau de Mythos Preview. Anthropic prévoit d’étendre progressivement : négocier avec le gouvernement américain pour augmenter le nombre de partenaires ; lancer un programme d’accès de confiance plus systématique pour les organisations de cybersécurité ; et ouvrir un plan de recherche biologique de confiance (enlevant les garde-fous biotech mais conservant ceux de cybersécurité) pour accélérer le développement de nouvelles thérapies. Cette approche "même modèle, déverrouillage par identité" est une première dans les lancements d’IA de frontier.
5. Tarification et accès : fenêtre API gratuite jusqu’au 22 juin
Tarification API pendant la période gratuite : 10 $ par million de tokens pour l’entrée, 50 $ par million de tokens pour la sortie — moins de la moitié de Mythos Preview. L’identifiant du modèle est claude-fable-5, et les plans API et entreprise à paiement à l’usage sont disponibles dès aujourd’hui. Les abonnés doivent noter :
◆ Jusqu’au 22 juin : les forfaits Pro, Max, Team et entreprise incluent Fable 5 gratuitement ;
◆ À partir du 23 juin : il sera retiré des forfaits, et l’utilisation continue nécessitera l’achat de crédits d’utilisation ; si la capacité le permet, la période gratuite pourrait être prolongée ;
◆ Ensuite : à mesure que la puissance de calcul rattrapera, Anthropic prévoit de réintégrer Fable 5 dans les forfaits d’abonnement standard. En d’autres termes, les deux prochaines semaines sont la meilleure fenêtre pour expérimenter gratuitement le modèle le plus puissant, alors les lecteurs intéressés devraient saisir cette opportunité.
6. Dernières réflexions : une "nouvelle approche" de la capacité et de la sécurité
Ces dernières années, les laboratoires de frontier n’avaient que deux options pour "que faire si le modèle est trop fort" : retarder la sortie ou réduire ses capacités. Anthropic propose une troisième solution — sortie complète avec des garde-fous dynamiques pour la version publique, tout en réservant la version complète aux institutions de confiance.
Cette approche n’est pas parfaite : 5 % de faux positifs peuvent frustrer certains utilisateurs professionnels (notamment les chercheurs en sécurité et biologistes), et la conservation des données pendant 30 jours pourrait soulever des préoccupations de confidentialité. Mais elle permet que la "capacité la plus puissante" ne soit pas verrouillée derrière des projets gouvernementaux, mais qu’elle entre dans le dialogue de tous de manière contrôlée. Lorsqu’une IA peut réaliser en un jour deux mois d’efforts d’équipe, ou concevoir indépendamment des candidats médicaments protéiques, "comment publier" devient aussi important que "quoi construire". Les racines communes de Fable et Mythos pourraient établir un précédent pour la stratégie de lancement des futurs modèles de frontier.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé