NVIDIA phát hành mã nguồn mở kiến trúc TwoTower, đạt được tốc độ tạo văn bản nhanh gấp 2,42 lần

Theo Beating, NVIDIA đã mã nguồn mở Nemotron-Labs-TwoTower, một kiến trúc khuếch tán văn bản rời rạc được thiết kế để tăng tốc quá trình tạo văn bản của mô hình ngôn ngữ lớn. Thiết kế hai khối tách biệt một mô hình tự hồi quy được đóng băng nhằm bảo toàn khả năng suy luận khỏi một khối khử nhiễu có thể huấn luyện, tạo văn bản song song. Chỉ sử dụng 1/12 dữ liệu tiền huấn luyện cơ sở trên mô hình Mamba-Transformer mixture-of-experts 30 tỷ tham số, TwoTower vẫn giữ được 98,7% chất lượng cơ sở đồng thời tăng tốc độ tạo lên 2,42 lần mà không tốn thêm bộ nhớ.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận