Anthropic Xác Định Ba Thay Đổi Ở Lớp Sản Phẩm Dẫn Tới Suy Giảm Chất Lượng Claude Code, Không Phải Lỗi Từ Mô Hình

Tin Cổng, ngày 23 tháng 4 — Nhóm kỹ thuật của Anthropic đã xác nhận rằng sự suy giảm chất lượng của Claude Code được người dùng báo cáo trong tháng qua bắt nguồn từ ba thay đổi độc lập ở lớp sản phẩm, không phải từ vấn đề API hay từ mô hình nền tảng. Ba vấn đề này đã được khắc phục lần lượt vào ngày 7 tháng 4, ngày 10 tháng 4 và ngày 20 tháng 4, với phiên bản cuối cùng hiện là v2.1.116.

Thay đổi đầu tiên diễn ra vào ngày 4 tháng 3, khi nhóm giảm mức độ nỗ lực suy luận mặc định cho Claude Code từ “high” xuống “medium” để xử lý các đỉnh độ trễ cực đoan thỉnh thoảng xảy ra ở Opus 4.6 khi cường độ suy luận cao. Sau khi nhận được nhiều phàn nàn từ người dùng về hiệu năng giảm, nhóm đã hoàn tác thay đổi vào ngày 7 tháng 4. Mặc định hiện tại bây giờ là “xhigh” cho Opus 4.7 và “high” cho các mô hình khác.

Vấn đề thứ hai là một lỗi được đưa vào ngày 26 tháng 3. Hệ thống được thiết kế để xóa các bản ghi suy luận cũ sau khi sự bất hoạt trong cuộc trò chuyện vượt quá một giờ nhằm giảm chi phí khôi phục phiên. Tuy nhiên, một sai sót trong quá trình triển khai khiến việc xóa được thực thi lặp lại ở mọi lượt tiếp theo thay vì chỉ chạy một lần, khiến mô hình dần dần mất đi ngữ cảnh suy luận trước đó. Điều này thể hiện qua sự hay quên ngày càng tăng, các thao tác lặp lại và việc gọi công cụ bất thường. Lỗi cũng dẫn đến bỏ sót cache ở mọi yêu cầu, làm tăng tốc việc tiêu hao hạn mức của người dùng. Hai thí nghiệm nội bộ không liên quan đã che giấu các điều kiện tái hiện, kéo dài quá trình gỡ lỗi lên hơn một tuần. Sau khi khắc phục vào ngày 10 tháng 4, nhóm đã xem xét mã gây vấn đề bằng Opus 4.7 và phát hiện rằng Opus 4.7 có thể nhận diện được lỗi trong khi Opus 4.6 thì không.

Thay đổi thứ ba được triển khai vào ngày 16 tháng 4 cùng với Opus 4.7. Nhóm đã thêm hướng dẫn vào system prompt để giảm đầu ra dư thừa. Kiểm thử nội bộ trong nhiều tuần cho thấy không có suy giảm, nhưng sau khi ra mắt, tương tác với các prompt khác đã làm chất lượng lập trình giảm đi. Đánh giá mở rộng cho thấy mức sụt giảm hiệu năng 3% ở cả Opus 4.6 và 4.7, dẫn đến việc quay lại vào ngày 20 tháng 4.

Ba thay đổi này đã tác động đến các nhóm người dùng khác nhau vào những thời điểm khác nhau, và tác động kết hợp của chúng tạo ra tình trạng suy giảm chất lượng rộng khắp và không nhất quán, làm cho việc chẩn đoán trở nên phức tạp. Anthropic cho biết hiện họ sẽ cần nhiều nhân viên nội bộ hơn để sử dụng cùng phiên bản bản dựng công khai như người dùng, chạy đầy đủ các bộ đánh giá mô hình cho mọi lần sửa đổi system prompt và triển khai các giai đoạn triển khai theo từng bước. Như một hình thức bù đắp, Anthropic đã đặt lại hạn mức sử dụng cho tất cả người dùng gói đăng ký.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

NVIDIA công bố Nemotron 3 Nano Omni mã nguồn mở đa phương thức

NVIDIA công bố Nemotron 3 Nano Omni mô hình đa phương thức mã nguồn mở, tích hợp tầm nhìn, giọng nói và ngôn ngữ trong một mô hình duy nhất, làm lớp cảm nhận cho tác nhân AI. Cốt lõi là 30B-A3B MoE, context 256K, thông lượng 9x, hỗ trợ các đầu vào như văn bản, hình ảnh, âm thanh, video…, đầu ra là văn bản. Cùng với Nemotron 3 Super/Ultra, phù hợp cho các kịch bản như thao tác máy tính, trí tuệ tài liệu và hiểu biết âm hình, đồng thời công khai trọng số và dữ liệu huấn luyện, triển khai bao phủ cục bộ, NIM và các nền tảng bên thứ ba.

ChainNewsAbmedia2phút trước

Claude Code thêm thông báo đẩy trên điện thoại: tự động nhắc nhở khi tác vụ dài hoàn thành hoặc khi cần phê duyệt

Claude Code hiện có thể gửi thông báo đẩy qua điện thoại, nhắc khi hoàn thành tác vụ dài hoặc khi cần sự can thiệp của người dùng. Điều kiện bật là Remote Control được khởi động và trong config có mục “Push when Claude decides”. Công cụ đẩy lớp dưới được thêm từ 15 tháng 4 phiên bản v2.1.110, thông báo này thuộc cấp độ marketing đối ngoại.

ChainNewsAbmedia1giờ trước

Claude tích hợp bộ kết nối 8 phần mềm sáng tạo lớn như Adobe, Blender, v.v.

Theo thông báo của blog chính thức của Anthropic ngày 28 tháng 4, Claude ra mắt chương trình Claude for Creative Work, hợp tác với 8 đối tác phần mềm sáng tạo để phát triển các bộ kết nối (connectors), nhằm mục tiêu giúp Claude có thể cộng tác trực tiếp trong các công cụ hiện có của các chuyên gia sáng tạo. Đồng thời, Anthropic Labs công bố sản phẩm mới Claude Design, và Anthropic cũng tham gia với tư cách patron vào Blender Development Fund. 8 bộ kết nối phần mềm sáng tạo: từ mô hình 3D đến điều khiển thời gian thực cho VJ Danh sách các phần mềm hợp tác với Anthropic để ra mắt connector lần này (theo thông báo chính thức của Anthropic sắp xếp theo

ChainNewsAbmedia1giờ trước

NVIDIA Ra Mắt Mô Hình Đa Phương Thức Nemotron 3 Nano Omni Với Mức Tăng Thông Lượng Gấp 9 Lần

Tin tức Cổng, 28 tháng 4 — NVIDIA đã phát hành Nemotron 3 Nano Omni, một mô hình đa phương thức mã nguồn mở có kiến trúc (MoE) dạng chuyên gia hỗn hợp (mixture-of-experts) 30B-A3B, với hỗ trợ cửa sổ ngữ cảnh 256K. Mô hình hợp nhất việc xử lý các đầu vào video, âm thanh, hình ảnh và văn bản trong một khuôn khổ duy nhất. So với

GateNews1giờ trước

Đức Loại Trừ Palantir Khỏi Dự Án Điện Toán Đám Mây Quân Sự Do Lo Ngại Về Chủ Quyền Dữ Liệu

Tin Cổng Thông Tin, ngày 28 tháng 4 — Chuẩn đô đốc Thomas Daum, sĩ quan cấp cao nhất của Đức trong lĩnh vực không gian mạng và thông tin, đã loại trừ việc triển khai phần mềm Palantir trong dự án điện toán đám mây quân sự chủ lực của Đức, viện dẫn những lo ngại về chủ quyền dữ liệu và mô hình vận hành của công ty Mỹ. Nước Đức

GateNews1giờ trước

Công ty khởi nghiệp tuyển dụng AI Dex huy động 5,3 triệu USD ở vòng hạt giống do Notion Capital dẫn dắt

Tin tức từ Gate, ngày 28 tháng 4 — Công ty khởi nghiệp tuyển dụng AI Dex đã công bố hoàn tất một vòng gọi vốn hạt giống trị giá 5,3 triệu USD do Notion Capital dẫn dắt, với sự tham gia từ a16z Speedrun, Concept Ventures và các nhà đầu tư thiên thần từ OpenAI cùng các công ty khác. Vòng gọi vốn đưa tổng số vốn của Dex lên 8,4 triệu USD

GateNews2giờ trước
Bình luận
0/400
Không có bình luận