根据 Beating,Anthropic 已无限期搁置 Claude Mythos Preview,这一款最新的安全性优先模型,并指出在部署更强的对齐机制之前存在重大网络安全风险。
在过去一个月与约 50 家合作伙伴(包括 Microsoft、Oracle、Cloudflare 和 Mozilla)开展协作式红队测试期间,该模型在全球关键基础设施中发现了超过 1 万个高危或关键严重性零日漏洞。仅 Mozilla 就在使用 Mythos Preview 的情况下,在 Firefox 中识别出 271 个漏洞,这相较于 Claude Opus 4.6 实现了十倍的改进。英国 AI Safety Institute 评估认为,Mythos Preview 是首个能够完全攻破所有模拟网络攻击场景的模型。Anthropic 认定,公开发布将显著降低恶意软件开发和网络攻击的门槛,从而对全球互联网和软件基础设施带来灾难性风险。