Moonshot AI Ra mắt Kimi K3 theo kế hoạch vào Q3 2026 với 2,5T+ Tham số và Ngữ cảnh 1M Token trong Thử nghiệm

Tin tức Cổng thông tin, ngày 27 tháng 4 — Theo các báo cáo, Moonshot AI dự định ra mắt Kimi K3 trong Q3 2026 (Tháng Bảy-Tháng Chín). Mô hình sẽ có hơn 2,5 nghìn tỷ tham số, và các thử nghiệm nội bộ cho thấy khả năng cửa sổ ngữ cảnh vượt quá 1 triệu token.

Tuy nhiên, liệu ngữ cảnh 1M này có được cung cấp trong bản phát hành công khai hay không vẫn còn chưa chắc chắn. Các nguồn tin cho biết, nút thắt chính giới hạn việc triển khai ngữ cảnh 1M không phải là năng lực kỹ thuật mà là tài nguyên tính toán. Phiên bản công khai hiện tại của Kimi, K2.6, duy trì cửa sổ ngữ cảnh 256K.

Việc phát triển này diễn ra trong bối cảnh DeepSeek V4 đã định vị ngữ cảnh 1M như một dịch vụ công khai, qua đó nâng chuẩn cho năng lực ngữ cảnh dài ở các mô hình mã nguồn mở có trọng số. Nếu Kimi K3 mang ngữ cảnh 1M đến bản phát hành công khai, Moonshot sẽ sánh ngang DeepSeek V4 về cả quy mô mô hình và hiệu năng ngữ cảnh dài.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Anthropic ra mắt Claude Dreams: Agent tự sắp xếp trí nhớ giữa các công việc, loại bỏ trùng lặp và mâu thuẫn

Anthropic tại sự kiện Code with Claude đã công bố Dreams, cho phép Claude Managed Agents tự động sắp xếp ký ức giữa nhiều phiên hội thoại, loại bỏ trùng lặp và mâu thuẫn, đồng thời cập nhật các mục cũ; xuất ra một kho ký ức đã được xử lý để có thể kiểm chứng. Giới hạn đầu vào là 100 session và 4.096 ký tự, chạy bất đồng bộ, hoàn tất trong vài phút đến vài chục phút, hỗ trợ quan sát theo thời gian thực. Bản xem trước nghiên cứu cần đăng ký; hiện chỉ hỗ trợ claude-opus-4-7 và claude-sonnet-4-6, thời điểm ra mắt chính thức vẫn chưa được xác định.

ChainNewsAbmedia7phút trước

Anthropic “cùng” SpaceX về sức mạnh điện toán: giành trọn bộ Colossus 1 với 220.000 GPU, Claude bỏ giới hạn hạn mức

Anthropic 宣 bố hợp tác năng lực tính toán với SpaceX cho trung tâm dữ liệu Colossus 1, sẽ huy động hơn 220.000 GPU Nvidia và công suất từ 300MW trở lên. Dự kiến trong vòng 1 tháng sẽ hoàn tất triển khai toàn bộ để Anthropic sử dụng, nhằm nâng cao hiệu năng và trải nghiệm cho Claude và Code. Đồng thời nới lỏng giới hạn sử dụng mỗi 5 giờ đối với Pro/Max/Team/Enterprise, xóa giới hạn trong khung cao điểm và tăng tốc độ API Opus. Cùng lúc, hạ tầng cơ sở tại châu Á và châu Âu cũng được mở rộng; trong tương lai còn có các ý định như “tính toán AI trên quỹ đạo”, nhưng hiện chưa có hợp đồng.

ChainNewsAbmedia18phút trước

Kỹ sư Coinbase: AI Agents có thể làm gián đoạn mô hình quảng cáo trên web

Erik Reppel, một kỹ sư tại Coinbase, cho biết các tác nhân trí tuệ nhân tạo có thể làm suy yếu một cách căn bản mô hình kinh doanh của internet vốn phụ thuộc vào quảng cáo. Theo Reppel, nền kinh tế web phụ thuộc nhiều vào doanh thu quảng cáo do người dùng tạo ra, nhưng các tác nhân AI sẽ vượt qua cơ chế đó

CryptoFrontier52phút trước

Anthropic tăng gấp đôi giới hạn tốc độ cho Claude Code sau khi chốt thỏa thuận với SpaceX giành 300MW công suất từ không gian

Theo Odaily, Anthropic đã ký một thỏa thuận với SpaceX để tiếp cận toàn bộ năng lực tính toán của trung tâm dữ liệu Colossus 1, đảm bảo hơn 300 megawatt công suất mới và hơn 220.000 GPU NVIDIA trong vòng một tháng. Có hiệu lực ngay lập tức, các giới hạn tốc độ theo giờ năm giờ của Claude Code dành cho Pro,

GateNews1giờ trước

OpenAI công bố giao thức mạng siêu máy tính MRC! Hợp tác với Nvidia, AMD, Microsoft để xây dựng hạ tầng Stargate

OpenAI công bố giao thức MRC cho mạng siêu máy tính AI, hợp tác với AMD, Microsoft, NVIDIA và nhiều đối tác khác, đồng thời mở mã nguồn trên OCP. MRC sẽ chia dữ liệu thành nhiều phần và cùng lúc chạy theo nhiều đường dẫn, né chướng ngại ở mức mili giây, giảm tắc nghẽn, duy trì đồng bộ GPU, qua đó giải quyết nút thắt truyền dẫn của các cụm huấn luyện quy mô lớn. Các trung tâm như Stargate tại Abilene, Texas và nhiều nơi khác đã triển khai giao diện 800Gb/s và đưa vào huấn luyện thực tế.

ChainNewsAbmedia1giờ trước

Nền tảng tuyển dụng AI Ethos hoàn tất vòng tài trợ Series A trị giá 22,75 triệu USD do a16z dẫn dắt vào ngày 6/5

Theo BlockBeats, nền tảng tuyển dụng AI có trụ sở tại London Ethos đã hoàn tất vòng tài trợ Series A trị giá 22,75 triệu USD vào ngày 6 tháng 5, với Andreessen Horowitz (a16z) dẫn đầu vòng và General Catalyst tham gia. Nền tảng sử dụng AI để phỏng vấn ứng viên và phân tích

GateNews2giờ trước
Bình luận
0/400
Không có bình luận