根据 Anthropic 在 6 月 11 日的官方 X 账号,公司为暗中降低了疑似在构建竞争 AI 模型的用户所获得的 Claude Fable 5 回应而道歉,承认不可见的防护措施是“错误的权衡”。从本周开始,被标记的请求将可见地回退至 Claude Opus 4.8,而不是静默地交付降质输出。在 API 上,用户在请求被拒绝时将收到明确的原因说明,并且服务器端回退通知将在接下来的几天内逐步推出。Anthropic 也承认了这种权衡:让防护措施变得可见会使其更容易被绕过,这意味着在公司调整其系统时,可能会出现更多针对合法机器学习工作的误报。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见
声明。