Meituan LongCat-2.0 mã nguồn mở: 1,6 nghìn tỷ tham số, không cần GPU NVIDIA

Theo Reuters đưa tin ngày 30 tháng 6, Meituan đã phát hành mô hình AI mã nguồn mở LongCat-2.0, quy mô tham số đạt 1,6 nghìn tỷ, sử dụng kiến trúc chuyên gia hỗn hợp thưa thớt (Sparse MoE), được huấn luyện hoàn toàn trên cụm siêu máy tính ASIC nội địa, không sử dụng bất kỳ GPU NVIDIA hay ngăn xếp phần mềm CUDA nào, cửa sổ ngữ cảnh mô hình đạt 1 triệu tokens.

Thông số kỹ thuật và trường hợp ứng dụng mục tiêu của LongCat-2.0

LongCat-2.0 sử dụng kiến trúc chuyên gia hỗn hợp thưa thớt (Sparse MoE), tương tự các giải pháp của DeepSeek và Mixtral thuộc Mistral: mô hình không kích hoạt đồng thời toàn bộ 1,6 nghìn tỷ tham số, mà sử dụng bộ định tuyến nội bộ để chọn một nhóm mô hình con chuyên biệt cho mỗi token, so với mô hình dày đặc cùng quy mô có thể giảm chi phí suy luận. Các thông số kỹ thuật chính và hạn chế triển khai như sau:

Quy mô tham số: 1,6 nghìn tỷ (kiến trúc MoE thưa thớt, không kích hoạt đồng thời toàn bộ tham số)

Cửa sổ ngữ cảnh: 1 triệu tokens (DeepSeek-R1-0528 và GPT-OSS đều là 128 nghìn)

Phần cứng huấn luyện: Cụm siêu máy tính ASIC nội địa (không GPU NVIDIA, không ngăn xếp phần mềm CUDA)

Ứng dụng mục tiêu: AI agent, công cụ mã hóa (hiểu mã, chỉnh sửa toàn bộ thư viện, tác vụ tự động hóa)

Hình thức triển khai: Cụm suy luận cấp trung tâm dữ liệu, không hỗ trợ thiết bị tiêu dùng hoặc hầu hết triển khai cục bộ

Bối cảnh thị trường huấn luyện chip nội địa và dữ liệu của Bernstein

Meituan tuyên bố kiến trúc suy luận cốt lõi của LongCat-2.0 có tính khả chuyển, có thể chạy trên phần cứng hiện có tại Trung Quốc. Việc phát hành này diễn ra trong bối cảnh các hạn chế xuất khẩu của Mỹ tiếp tục hạn chế xuất khẩu chip AI tiên tiến sang các doanh nghiệp Trung Quốc.

Công ty nghiên cứu chứng khoán Bernstein ước tính, NVIDIA hiện chiếm khoảng 40% thị phần chip AI tại Trung Quốc, Huawei có thị phần tương tự; Bernstein đồng thời dự đoán, Huawei sẽ đạt được tiến bộ trong năm nay, khiến thị phần của NVIDIA tại thị trường Trung Quốc giảm khoảng 8 điểm phần trăm.

Trạng thái hiện tại của tuyên bố hiệu suất: chưa có xác minh từ bên thứ ba

Trong các bài kiểm tra chuẩn đã công bố, Meituan so sánh LongCat-2.0 với nhiều mô hình nguồn đóng, nhưng các báo cáo liên quan chỉ ra rằng các tuyên bố về hiệu suất này cho đến nay vẫn chưa nhận được đánh giá xác minh độc lập công bằng từ bên thứ ba.

Báo cáo cũng chỉ ra rằng, việc tối ưu hóa cho chip nội địa có thể hạn chế hiệu suất của LongCat-2.0 trên phần cứng NVIDIA, trong khi phần cứng NVIDIA hiện vẫn thống trị các trung tâm dữ liệu toàn cầu. Meituan cho biết kiến trúc suy luận cốt lõi của họ vẫn có tính khả chuyển, và các thử nghiệm độc lập sẽ quyết định mức độ chấp nhận của các nhà phát triển bên ngoài Trung Quốc.

Câu hỏi thường gặp

Cửa sổ ngữ cảnh 1 triệu token của LongCat-2.0 có ý nghĩa gì đối với các trường hợp ứng dụng nào?

Tính đến thời điểm đưa tin, giới hạn cửa sổ ngữ cảnh của DeepSeek-R1-0528 và OpenAI GPT-OSS đều là 128 nghìn tokens; LongCat-2.0 tuyên bố đạt 1 triệu tokens, có ý nghĩa tiềm năng đối với các ứng dụng AI agent cần xử lý các kho mã cực dài và chuỗi tác vụ phức tạp. Tuy nhiên, các tuyên bố thông số kỹ thuật trên vẫn chờ xác minh độc lập.

Bối cảnh nghiên cứu AI của Meituan là gì?

Hoạt động kinh doanh cốt lõi của Meituan là giao đồ ăn và dịch vụ đời sống địa phương. Năm 2023, họ mua lại công ty khởi nghiệp AI Light Year Beyond với giá 281 triệu USD, sau đó tiến vào lĩnh vực AI, đến năm 2025 mới công khai công bố kế hoạch mô hình nội bộ. LongCat-2.0 được định vị là công cụ suy luận cho các AI agent và công cụ mã hóa của công ty.

Kiến trúc MoE thưa thớt của LongCat-2.0 so với mô hình dày đặc 1,6 nghìn tỷ có ưu nhược điểm gì?

Ưu điểm cốt lõi của MoE thưa thớt là không kích hoạt toàn bộ tham số, định tuyến đến các mô hình con cụ thể, so với mô hình dày đặc cùng quy mô có thể giảm chi phí tính toán suy luận. Tuy nhiên, kiến trúc được tối ưu hóa cho phần cứng cụ thể (như ASIC nội địa) có thể có hạn chế về hiệu suất trên phần cứng khác (như GPU NVIDIA), kết quả thử nghiệm độc lập chưa được công bố.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận