Gate News 消息,4月23日——Anthropic 的工程团队确认,用户在过去一个月中报告的 Claude Code 质量退化源于三个相互独立的产品层变更,而非 API 或底层模型问题。这三个问题分别在 4月7日、4月10日和 4月20日得到修复,当前最终版本为 v2.1.116。
第一项变更发生在 3月4日。为了解决在 Opus 4.6 高推理强度下偶发出现的极端延迟峰值,团队将 Claude Code 的默认推理工作量等级从 “high” 降为 “medium”。在大量用户抱怨性能下降后,团队在 4月7日撤回了该变更。目前在 Opus 4.7 上默认为 “xhigh”,在其他模型上默认为 “high”。
第二个问题是在 3月26日引入的一个漏洞。系统被设计为在对话不活跃超过一小时后清除旧的推理记录,以降低会话恢复成本。然而,实现中的缺陷导致清除操作在之后每一次轮次中反复执行,而不是只执行一次,从而使模型逐步丢失既有推理上下文。该问题表现为越来越健忘、重复操作以及异常的工具调用。该漏洞还导致每次请求都发生缓存未命中,从而加速用户配额的消耗。两个彼此无关的内部实验掩盖了复现条件,使得调试过程延长到超过一周。在 4月10日修复后,团队使用 Opus 4.7 检查了有问题的代码,并发现 Opus 4.7 能识别该漏洞,而 Opus 4.6 无法。
第三项变更于 4月16日与 Opus 4.7 同期上线。团队在系统提示词中加入了指令,以减少冗余输出。几周的内部测试表明不会出现回归,但上线后与其他提示词的交互会降低编码质量。更长时间的评估显示 Opus 4.6 和 4.7 的性能均下降 3%,因此团队在 4月20日执行了回滚。
这三项变更在不同时间影响了不同用户群体,它们叠加产生了广泛且不一致的质量下滑,使得诊断变得更加复杂。Anthropic 表示,现在它将需要更多内部员工像用户一样使用相同的公开构建版本,对每一次系统提示词修改都运行完整的模型评估套件,并实施分阶段的灰度发布期。作为补偿,Anthropic 已重置所有订阅用户的使用配额。
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Meituan Quietly Launches LongCat-2.0-Preview AI Model With Trillion Parameters, No Official Announcement
Gate News message, April 28 — Meituan has quietly rolled out a new AI model, LongCat-2.0-Preview, on its LongCat API platform with an update log dated April 20, but has not issued any official announcement or technical report. Unlike previous LongCat series models
GateNews24м назад
Kimi K2.6 возглавляет рейтинги LLM OpenRouter в первую неделю, использование выросло на 7 683%
Сообщение Gate News, 28 апреля — модель Kimi K2.6 от Moonshot AI, флагманская модель, вышла на первое место в еженедельном рейтинге LLM OpenRouter, набрав 1,88 трлн токенов, и продемонстрировала всплеск на 7 683% по сравнению с прошлой неделей. Запущенная на OpenRouter 20 апреля модель всего за неделю обогнала Claude Sonnet 4.6 (1.35T, -3%) и DeepSeek V3.2 1.24T.
GateNews35м назад
После появления ChatGPT число публикаций в журналах по менеджменту за учебный семестр выросло на 42%: ИИ продвигает науку скорее в сторону «большего количества», а не «качества»
Редакционная статья отмечает, что после запуска ChatGPT количество публикаций выросло на 42%, а штат редакции также существенно пополнили. Из‑за ИИ возникло наводнение низкокачественных материалов: нагрузка на рецензирование увеличилась вдвое, при этом давление на первичный отбор по‑прежнему сохраняется. Моллик указывает, что проблема заключается в том, что система мотивации предпочитает «больше», а не «лучше»; необходимо повышать достоверность за счет механизмов, ориентированных на качество, и таких, как отслеживаемый исследовательский процесс, и предупреждает, что в других областях, где также требуется ручная проверка специалистов, существуют похожие вызовы.
ChainNewsAbmedia51м назад
DeepMind × 韩国 MOU:первый зарубежный AI-кампус, подпись Хассабиса лично
DeepMind исполнительный директор Хассабис лично прибыл в Сеул и подписал MOU с правительством Южной Кореи, чтобы ускорить развитие наук о жизни, климатические исследования и научные открытия с помощью ИИ. В основе — создание зарубежного AI Campus в Google Seoul, предоставление доступа к моделям и обмена между исследователями, а также запуск в 2026 году национального центра AI научных исследований с фокусом на науки о жизни, климат и фундаментальные науки; при этом ведется сотрудничество с такими компаниями, как Samsung, SK Hynix, Hyundai Motor, LG и др., что демонстрирует глобальную конкурентоспособность и влияние Кореи в области ИИ и полупроводников.
ChainNewsAbmedia53м назад
Google тестирует функцию поиска в стиле чат-бота с ИИ «Спроси YouTube»
Сообщение Gate News от 28 апреля — Google тестирует экспериментальную функцию с ИИ под названием "Спроси YouTube", которая позволяет пользователям искать по видеоконтенту с помощью запросов на естественном языке. В настоящее время функция доступна только пользователям в возрасте 18 лет и старше в Соединенных Штатах с подпиской YouTube Premium
GateNews1ч назад
Nanya будет поставлять память LPDDR5X для платформы Nvidia Vera Rubin AI
Сообщение Gate News, 28 апреля — тайваньский производитель микросхем памяти Nanya Technology будет поставлять маломощную DRAM LPDDR5X для платформы Nvidia следующего поколения Vera Rubin AI, используя формат модуля памяти SOCAMM2.
Nvidia добавляет Nanya в качестве резервного поставщика наряду с Samsung Electronics и SK Hynix, чтобы снизить риск поставок
GateNews1ч назад