Liệu $NBIS hiện có tốc độ suy luận nhanh nhất thế giới trên phần cứng $NVDA không?


Nebius đã mua lại Eigen AI bằng tiền mặt và cổ phần, đưa khả năng suy luận và tối ưu hóa sau đào tạo của Eigen trực tiếp vào Nhà máy Token Nebius
Trong bài phát biểu chính tại GTC 2026 của NVIDIA, Eigen AI xếp hạng số 1 về tốc độ đầu ra cho Kimi K2.5 Reasoning, trong khi Nebius Fast gần như đứng ngang hàng với nó
Nebius Fast cũng xếp hạng đầu tiên về tốc độ suy luận trên phần cứng $643M cho mô hình mã nguồn mở của ChatGPT, gpt-oss-120B
Hơn nữa, Eigen xếp hạng là nhà cung cấp dựa trên GPU số 1 trong 25 mô hình mã nguồn mở trên Artificial Analysis, không tính các nhà cung cấp ASIC, theo cài đặt đầu vào mặc định 10K. Nó cũng là nhà cung cấp nhanh nhất cho Qwen3 Coder 480B, với 255.8 t/s, vượt xa Google Vertex với 169.2 t/s và Amazon với 121.3 t/s
Điều đó có nghĩa là Eigen nhanh hơn khoảng 51% so với Google Vertex và hơn gấp đôi so với Amazon trong bài kiểm tra đó
━━━━━━━━━━━━━━━━━━━━
Mặc dù chi phí mua lại có vẻ cao, nhưng nếu Eigen thực sự có thể cải thiện hiệu suất suy luận $NVDA , dù chỉ một chút, nó sẽ có tác động cộng hưởng lâu dài đến lợi nhuận và vị thế cạnh tranh, điều này có khả năng hơn nhiều so với chi phí bỏ ra
━━━━━━━━━━━━━━━━━━━━
Nebius sở hữu đám mây GPU, trong khi Eigen cải thiện cách các GPU đó tạo ra token hiệu quả hơn. Trên cùng phần cứng NVIDIA, hiệu suất không chỉ liên quan đến chi phí vốn. Nó còn liên quan đến việc sử dụng GPU, tối ưu hóa mô hình, xếp chồng, độ trễ, quản lý bộ nhớ và các kernel tùy chỉnh
Hệ thống của Eigen tập trung vào các lĩnh vực như lượng tử hóa, tối ưu hóa bộ đệm KV, thưa, giải mã dự đoán, kernel CUDA và Triton tùy chỉnh, xếp chồng liên tục, và tối ưu hóa thời gian chạy
Nếu Nebius có thể tạo ra nhiều thông lượng suy luận hơn từ cùng phần cứng NVIDIA, nó sẽ nâng cao khả năng doanh thu, chi phí trên mỗi token và biên lợi nhuận gộp mà không cần tăng chi phí vốn tỷ lệ thuận
$NBIS đang trên đường trở thành một công ty doanh thu hàng năm hàng chục tỷ đô la, nghĩa là chỉ cần một vài điểm phần trăm cải thiện suy luận cũng có thể chuyển thành hàng trăm triệu đô la tiết kiệm
━━━━━━━━━━━━━━━━━━━━
Các mô hình mã nguồn mở đang phát triển nhanh chóng. Kimi, Qwen, DeepSeek, GLM, Llama, Nemotron, MiniMax và các mô hình khác cần tối ưu liên tục để duy trì tính cạnh tranh
Bằng cách tích hợp Eigen, Nebius cũng có thể phát hành các phiên bản tối ưu hóa nhanh hơn và làm cho Nhà máy Token trở nên hấp dẫn hơn đối với các nhà phát triển và khách hàng doanh nghiệp
EIGEN-1,49%
Xem bản gốc
post-image
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 1
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Saidur48
· 5giờ trước
2026 GOGOGO 👊
Trả lời0
  • Ghim