Anthropic 釐清:Claude Code 品質下滑源自三項產品層變更,而非模型問題

快訊消息,4月23日—Anthropic 的工程團隊確認,過去一個月使用者所報告的 Claude Code 品質退化,源自三項彼此獨立的產品層變更,而非 API 或底層模型問題。這三個問題分別在 4 月 7 日、4 月 10 日和 4 月 20 日修復,目前的最終版本為 v2.1.116。

第一項變更發生在 3 月 4 日。團隊將 Claude Code 的預設推理工作量等級從「high」降低到「medium」,以解決在高推理強度下 Opus 4.6 偶發出現極端延遲尖峰的情況。由於廣泛的使用者投訴效能下降,團隊在 4 月 7 日將該變更回退。目前,Opus 4.7 的預設為「xhigh」,其他模型的預設為「high」。

第二個問題是 3 月 26 日引入的程式錯誤。系統原本設計為在對話不活躍超過一小時後清除舊的推理紀錄,以降低會話復原成本。然而,實作中的缺陷導致該清除動作在後續每一次回合都會重複執行,而不是只執行一次,因而使模型逐步失去先前的推理脈絡。這表現為越來越健忘、重複操作,以及異常的工具呼叫。該錯誤也使每次請求都發生快取未命中,加速了使用者配額的消耗。兩個彼此無關的內部實驗掩蓋了重現條件,使除錯過程延長到超過一週。修復於 4 月 10 日完成後,團隊使用 Opus 4.7 檢查問題程式碼,並發現 Opus 4.7 能夠識別該錯誤,而 Opus 4.6 則不能。

第三項變更於 4 月 16 日與 Opus 4.7 一同推出。團隊在系統提示詞中加入指令,以降低冗餘輸出。數週的內部測試顯示沒有回歸,但在上線後與其他提示詞的互動卻使程式碼品質下降。延長評估後發現,Opus 4.6 與 4.7 的效能均下降 3%,因此在 4 月 20 日回滾。

這三項變更分別在不同時間影響了不同使用者群組,而它們的綜合效果導致普遍且不一致的品質下滑,使診斷更加困難。Anthropic 表示,現在將需要更多內部員工使用與使用者相同的公開建置版本、針對每次系統提示詞修改都執行完整的模型評估測試套件,並實施分階段推出期。作為補償,Anthropic 已重置所有訂閱使用者的使用配額。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

X (推特) 迎來 20 年最大廣告平台升級,xAI 介入,AI 語意投放成核心

X 宣布自2026年4月起推出20年來最大廣告平台改造,重建底層技術並結合 xAI。新平台以 AI 驅動成效優化、語意與情境廣告為核心,提升操作便利與投放控管,目標把廣告轉化為即時語境的商業信號,並配合 Everything App 策略成為 X 生態的商業引擎。

鏈新聞abmedia1小時前

OpenAI 支援的 1X 在加州開設 58,000 平方英尺工廠,第一年目標部署 10,000 台機器人

根據彭博社,1X Technologies 是一家挪威成立、獲 OpenAI 支援的機器人新創公司,已在美國加州海沃德(Hayward)開設了一座 58,000 平方英尺的製造工廠,目標是成為大規模生產消費級人形機器人的先驅。 預計該工廠將在其

GateNews4小時前

白宮起草 AI 政策備忘錄,指示美國各機關於 4 月 30 日採用多家 AI 供應商

根據 PANews 在 4 月 30 日援引的消息來源,白宮官員正在起草一份廣泛的人工智慧政策備忘錄,指示美國政府機構採用多家 AI 服務供應商,並避免依賴單一供應商。該備忘錄也要求所有受僱於合約的 AI 公司

GateNews4小時前

中國網信辦於 4 月 30 日啟動為期 4 個月的行動,以遏制 AI 應用的混亂局面

根據 CCTV News,中國網信辦於 4 月 30 日啟動為期四個月的全國性行動,以解決 AI 應用混亂問題。該行動分兩個階段部署,目標針對包括模型註冊缺失、平台安全與審查能力不足等問題,

GateNews5小時前

Forefront Tech 完成 $100M IPO 定價,並在 Nasdaq 以代碼 FTHAU 上市

根據 ChainCatcher,特殊目的收購公司 Forefront Tech 已於 4 月 30 日完成 1 億美元 IPO 定價,並將以代號 FTHAU 在那斯達克上市。該公司計劃使用募資所得以追求區塊鏈、金融科技、人工智慧方面的併購機會

GateNews6小時前

Anthropic Claude Code 因計費錯誤向用戶多收 200.98 美元,最初拒絕退款,直到完成全額賠償

根據 Beating 的監測,Anthropic 的 Claude Code 服務中的計費漏洞導致一名 Max 20x 訂閱者在額外使用費上被多收 200.98 美元,儘管該訂閱者只使用了每月配額的 13%。該漏洞在使用者的 git 儲存庫提交歷史包含大寫時觸發

GateNews6小時前
留言
0/400
暫無留言