第一项变更发生在 3月4日。为了解决在 Opus 4.6 高推理强度下偶发出现的极端延迟峰值，团队将 Claude Code 的默认推理工作量等级从 "high" 降为 "medium"。在大量用户抱怨性能下降后，团队在 4月7日撤回了该变更。目前在 Opus 4.7 上默认为 "xhigh"，在其他模型上默认为 "high"。

第二个问题是在 3月26日引入的一个漏洞。系统被设计为在对话不活跃超过一小时后清除旧的推理记录，以降低会话恢复成本。然而，实现中的缺陷导致清除操作在之后每一次轮次中反复执行，而不是只执行一次，从而使模型逐步丢失既有推理上下文。该问题表现为越来越健忘、重复操作以及异常的工具调用。该漏洞还导致每次请求都发生缓存未命中，从而加速用户配额的消耗。两个彼此无关的内部实验掩盖了复现条件，使得调试过程延长到超过一周。在 4月10日修复后，团队使用 Opus 4.7 检查了有问题的代码，并发现 Opus 4.7 能识别该漏洞，而 Opus 4.6 无法。

第三项变更于 4月16日与 Opus 4.7 同期上线。团队在系统提示词中加入了指令，以减少冗余输出。几周的内部测试表明不会出现回归，但上线后与其他提示词的交互会降低编码质量。更长时间的评估显示 Opus 4.6 和 4.7 的性能均下降 3%，因此团队在 4月20日执行了回滚。

这三项变更在不同时间影响了不同用户群体，它们叠加产生了广泛且不一致的质量下滑，使得诊断变得更加复杂。Anthropic 表示，现在它将需要更多内部员工像用户一样使用相同的公开构建版本，对每一次系统提示词修改都运行完整的模型评估套件，并实施分阶段的灰度发布期。作为补偿，Anthropic 已重置所有订阅用户的使用配额。

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

04-23 20:42

Утечка в системе безопасности Vercel расширилась до сотен пользователей; разработчики ИИ находятся в группе повышенного риска

04-23 13:58

ЕС подготовит руководящие принципы, требующие от Google предоставлять сторонним приложениям ИИ равный доступ на Android, как у Gemini

04-23 08:33

Anthropic запускает /ultrareview для Claude Code: облачное код-ревью с мультиагентной моделью

04-23 05:28

Google Jules переименовывает себя в платформу сквозной агентной разработки продуктов и открывает список ожидания для новой версии

04-23 02:22

Австралия работает с Anthropic, чтобы устранить риски кибербезопасности Mythos AI

Детальный анализ

Anthropic раскрывает, что в Code произошла каскадная комбинация из 3 багов: деградация рассуждений, забывание кэша, обратное действие 25-символьной команды

ChainNewsAbmedia04-23 18:14

Google Юльс публикует список кандидатов на открытую версию и повторно позиционируется как платформа для разработки продуктов end-to-end

Market Whisper04-23 06:13

Claude Mythos обнаружил 271 уязвимость в Firefox, у защитников есть шанс получить решающее преимущество

Market Whisper04-22 05:36

комментарий

0/400

Нет комментариев