Hôm nay điều quan trọng nhất là hội nghị GTC của NVIDIA, gần như là một bản AI của Lược sử loài người.

robot
Đang tạo bản tóm tắt

Hôm nay điều quan trọng nhất là hội nghị GTC của NVIDIA, đúng là một cuốn “Sử ký loài người” phiên bản AI.

Chưa kịp lên sân khấu, lượng thông tin bị rò rỉ trước đã đủ để viết một cuốn sách.

Tối Tối đã tổng hợp ba điểm đáng chú ý lớn, mời các bạn béo nhé, đi theo tôi.

1)Chi phí năng lực tính AI giảm thẳng còn một phần mười

Thế hệ Blackwell trước đó đã rất mạnh rồi, đúng không? Sắp tới sẽ công bố sản xuất hàng loạt chip thế hệ mới Vera Rubin.

Vera Rubin mạnh ở chỗ nào? Nói thẳng ra là hai chữ: rẻ.

Chạy cùng một mô hình AI, số lượng chip giảm còn một phần tư, chi phí tính toán suy luận giảm chín phần mười. Giảm chín phần mười cơ mà các bạn. Ba “ông lớn” dịch vụ đám mây là AWS, Microsoft và Google trực tiếp lên xe ngay đợt đầu.

2)Groq mua hồi năm ngoái 20 tỷ đô hôm nay nộp bài

Trước đó tại cuộc họp về kết quả kinh doanh, Hoàng Nhân Quân từng nói rằng Groq sẽ được tích hợp vào hệ sinh thái NVIDIA như một kiến trúc mở rộng, giống như hồi đó mua Mellanox để bổ sung năng lực mạng vậy.

LPU của Groq và GPU của NVIDIA nằm chung một trung tâm dữ liệu: GPU hiểu vấn đề, còn LPU chịu trách nhiệm “nhả” đáp án thật nhanh.

Hai loại chip phân công phối hợp, độ trễ trong các kịch bản Agent sẽ lập tức bị đánh tụt.

AI Agent thay con người làm việc, một nhiệm vụ có thể qua lại điều chỉnh mô hình hàng chục lần; mỗi vòng đều đang đốt năng lực tính suy luận, mà người dùng thì vẫn ngồi đó chờ — chậm một chút là trải nghiệm sập ngay.

Suy luận được chia làm hai bước: trước hết hiểu câu hỏi của bạn, rồi từng chữ một nhả đáp án ra.

GPU giỏi bước đầu, nhưng bước nhả chữ và độ ổn định ở bước thứ hai, LPU của Groq lại mạnh hơn.

200 tỷ này có đắt không?

Bạn nghĩ xem: sau này mỗi công ty sẽ chạy vài trăm Agent, mỗi Agent mỗi ngày lại điều chỉnh mô hình vài nghìn lần.

3)Nền tảng “OpenClaw” phiên bản NVIDIA lên sóng, tên là NemoClaw

Nó là một bộ nền tảng mã nguồn mở; doanh nghiệp cài lên là triển khai được “nhân viên AI” để chạy quy trình thay con người, xử lý dữ liệu, quản dự án. Nghe nói nó đã đang đàm phán với Salesforce và Adobe.

Điểm thú vị nằm ở chỗ: NemoClaw không bắt bạn phải dùng chip của NVIDIA. Bạn ngẫm xem logic này thế nào đi. Bán chip chỉ kiếm tiền ở một tầng phần cứng; muốn kiếm tiền trên cả chuỗi thì phải đặt ra luật chơi. Hoàng Nhân Quân tính khoản này quá rành.

4)Hoàng Nhân Quân nói sẽ trình diễn “những con chip mà thế giới chưa từng thấy”

Khả năng cao là kiến trúc thế hệ kế tiếp, Feynman, lần đầu lộ diện; sản xuất hàng loạt vào năm 2028, quy trình 1.6nm tiên tiến nhất của TSMC.

Ngoài ra còn có một mẩu tin khá “đồ hiếm” mà tôi thấy cũng thú vị.

NVIDIA đã làm bộ vi xử lý cho laptop, có hai phiên bản, tập trung vào chơi game. Bên bán card màn hình sắp phải giành lấy “miếng bánh” CPU rồi à.

Tối Tối tôi cảm thấy, tương lai Hoàng Nhân Quân sẽ trở thành một bậc vĩ nhân của một thời đại.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Ghim