DeepSeek V4 ra mắt sau: Zhì pǔ, MiniMax giảm mạnh, Nvidia hoảng loạn

DeepSeek V4 cuối cùng đã ra mắt. Đây là một khoảnh khắc được chờ đợi gần năm tháng. Mô hình chính MoE 1T tham số + phiên bản Flash 285B tham số, toàn bộ phiên bản Pro 1.6T đi kèm, hoàn chỉnh mã nguồn mở trên GitHub, theo giấy phép Apache 2.0, trọng số và mã triển khai đồng bộ phát hành.

Ngay khi mô hình ra mắt, thị trường vốn đã đưa ra câu trả lời theo ba cách độc lập nhưng lại liên kết chặt chẽ với nhau.

Phản ứng khác nhau của thị trường vốn

Chuỗi sức mạnh tính toán của cổ phiếu A gần như tăng vọt toàn diện. Cambrian đã có 11 ngày liên tiếp tăng giá, tăng 3.7% trong ngày, tổng tăng trong tháng vượt 60%. Hải Quang Information chạm mức trần tăng 10% trong phiên, đóng cửa +8.4%. Sở Giao dịch Chứng khoán Thâm Quyến của SMIC tăng +4.91%, Hồng Kông +8.81%. Huệ Hồng Hồng Kông đạt đỉnh +18%, đóng cửa +12%. Quỹ ETF cổ phiếu công nghệ quốc gia của Khoa học và Công nghệ (KST) hút ròng 2.4 tỷ nhân dân tệ trong ngày, quy mô đạt đỉnh lịch sử.

Phía các công ty mô hình lớn trên thị trường Hồng Kông lại mang màu sắc khác. Zhizhi (02513.HK) giảm 8.07%, tỷ lệ bán khống 9.9%. MiniMax (00100.HK) giảm 7.40%, tỷ lệ bán khống tăng vọt lên 22.87%. Đây là dữ liệu bán khống ngày cao nhất trong 3 tháng qua của ngành AI Hồng Kông. Hai công ty này đều đại diện cho làn sóng IPO AI Hồng Kông dự kiến vào nửa cuối năm 2025, trong hồ sơ IPO nhấn mạnh vào lợi thế cạnh tranh cốt lõi là “mô hình nền tự nghiên cứu”.

Phản ứng từ phía Thái Bình Dương cũng rất rõ ràng. Tối qua, Nvidia mở cửa giảm 1.8%, trong phiên giảm sâu tới -2.6%, cả ngày đóng cửa trung tính. Đánh giá nhanh của Bloomberg so sánh đợt điều chỉnh này với “Khoảnh khắc DeepSeek” ngày 27 tháng 1 của V3. Khác biệt là, lần đó là bán tháo hoảng loạn, mất đi 600 tỷ USD giá trị thị trường trong một ngày. Lần này giống như một sự định giá lại, quy mô nhẹ nhàng nhưng hướng đi rõ ràng. Trong các báo cáo nghiên cứu của các tổ chức mua vào, xuất hiện một câu mới: “Nhu cầu suy luận AI của Trung Quốc bắt đầu tách rời khỏi nhu cầu suy luận AI của Bắc Mỹ”.

Kết hợp ba bức tranh này lại, chính là bản án đầu tiên của thị trường trong vòng 24 giờ sau khi V4 ra mắt. Sau khi mã nguồn mở chiến thắng, dòng tiền bắt đầu chọn phe lại, không còn định giá mô hình nữa, mà là mô hình chạy trên card nào, lắp vào chuỗi ngành nào.

30 ngày 11 mô hình mới, V4 thắp thêm lửa cho phe mở nguồn

Thời điểm ra mắt của V4 chính là một phần lý do khiến phản ứng này được khuếch đại.

Hãy nhìn lại 30 ngày qua. Từ ngày 26 tháng 3 đến 24 tháng 4, ít nhất có 11 mô hình lớn ảnh hưởng đáng kể được ra mắt hoặc cập nhật quan trọng, danh sách này bao gồm gần như tất cả các đối thủ chính. Anthropic Opus 4.6, Google Gemini 3.1 Pro, OpenAI GPT-5.5, Mistral Large 3, Meta Llama 4, Kimi K2.6 của tháng tối, Alibaba Qwen3-Next, ByteDance Doubao 2.5 Pro, Tencent Hun Yuan 3.0, Kimi K2.6 Plus, và cuối cùng là DeepSeek V4 ra mắt vào sáng ngày 23 tháng 4.

Trung bình cứ mỗi 2.7 ngày lại có một mô hình mới ra đời. Đây là tốc độ mà ngay cả các quản lý quỹ cũng không kịp đọc hết bản phát hành. Nhưng xem lại biểu đồ K của AI Trung Quốc-Hồng Kông trong 30 ngày này, chỉ có một cái tên để lại dấu ấn liên tục trên thị trường. GPT-5.5 ngày 8 tháng 4 đã thúc đẩy Nvidia tăng 4.2% trong ngày, đạt đỉnh trong ngày đó. Sau đó, ngày 23-24 tháng 4, DeepSeek V4 đã thúc đẩy chuỗi sức mạnh tính toán Trung Quốc-Hồng Kông tăng liên tiếp.

Sự khác biệt không nằm ở khả năng của mô hình. Khoảng cách giữa 11 mô hình này trên bảng xếp hạng LMArena, trong hầu hết các trường hợp, không quá 50 điểm, nằm trong “cùng phân khúc”. Sự khác biệt nằm ở hai yếu tố cộng hưởng.

Thứ nhất là mở nguồn. Trong 10 mô hình đầu, chỉ có Llama 4 mở nguồn, nhưng giấy phép của Llama 4 kèm theo nhiều hạn chế thương mại, cộng đồng phát triển châu Âu-Mỹ phản ứng khá lạnh nhạt, chỉ sau 3 ngày ra mắt OpenRouter đã rơi khỏi top 10. Giấy phép của V4 là Apache 2.0, không giới hạn trọng số, không hạn chế thương mại, mã suy luận đồng bộ mở ra. Đây là mô hình mở nguồn đầu tiên trong nửa năm qua khiến các mô hình đóng nguồn phải chịu áp lực cùng lúc về hiệu suất, giá cả và độ mở.

Thứ hai là thời điểm. Trong bối cảnh các mô hình đóng nguồn liên tục ra đòn, câu chuyện mở nguồn đang bị đẩy lùi liên tục. Opus 4.6 đẩy điểm số của SWE-Bench lên mức cao mới, GPT-5.5 định giá mỗi triệu token ở mức 1.25 USD, như một điểm neo giá thấp. Liệu mở nguồn có thể bắt kịp đóng nguồn hay không, cuộc tranh luận này đã kéo dài hai năm tại Silicon Valley. V4 với một mô hình mở nguồn dự kiến đạt 90 triệu người dùng hoạt động hàng tháng đã tạm dừng cuộc tranh luận này.

Theo một quản lý quỹ lớn trong nước trong buổi roadshow, “Trước V4, chúng tôi đã đánh giá thấp mô hình mở nguồn, sau V4, mức đánh giá đó bắt đầu ngược lại.”

DeepSeek thay đổi bảng giá của chuỗi cung ứng sức mạnh tính toán

Trong bản phát hành của V4 có một câu chưa từng xuất hiện trong bất kỳ tài liệu chính thức nào về mô hình lớn Trung Quốc: “Day 0 toàn bộ hệ thống phù hợp với Cambrian Shiyuan 590 và Huawei Ascend 950PR, mã nguồn mở đồng bộ.” Nội dung của câu này cần kết nối ba đường dây ngầm song song trong 12 tháng qua mới rõ ràng. Ba đường dây này lần lượt thuộc về phần cứng, phần mềm và phản ứng của Silicon Valley.

Đường dây thứ nhất là về phần chip. Huawei Ascend 950PR chính thức sản xuất vào tháng 12 năm 2025, công suất FP4 1.56 PFLOPS, dung lượng HBM 112GB, là lần đầu tiên chip AI nội địa so sánh trực tiếp về chỉ số kỹ thuật với dòng B của Nvidia. Trong các nhiệm vụ suy luận MoE 1T tham số của V4, thông qua một card, hiệu suất xử lý tăng gấp 2.87 lần so với H20. Hệ sinh thái phần mềm CANN 8.0, tối ưu hóa khung suy luận LLM ở cấp độ toán tử, Benchmark công khai của DeepSeek cho thấy, trong các node siêu của Ascend (8 card 950PR), độ trễ suy luận cuối cùng trên toàn bộ hệ thống thấp hơn 35% so với cụm H100 cùng quy mô. Dữ liệu của Cambrian Shiyuan 590 còn ấn tượng hơn, hiệu suất FP8 trên chip đơn so sánh H100, giá bán chưa bằng một nửa.

Đường dây thứ hai là về phần mềm. Nhánh chính của vLLM đã hợp nhất PR backend MLU của Cambrian vào ngày 22 tháng 4, lần đầu tiên hỗ trợ nguyên bản suy luận trên nền tảng không phải Nvidia bằng mã nguồn mở. DCU của Hải Quang Information qua hệ sinh thái ROCm đi một con đường khác, nhưng vẫn chạy được đầy đủ lớp routing MoE của V4. Điều này có nghĩa là, việc triển khai V4 không còn chỉ có thể chạy trên một loại card nội địa, mà có thể chọn giữa nhiều loại card nội địa khác nhau. Sự phụ thuộc vào nhà cung cấp duy nhất trong hệ sinh thái đã bị phá vỡ, đây là bước ngoặt quan trọng của sản xuất.

Đường dây thứ ba đến từ Silicon Valley. Ngày 15 tháng 4, Jensen Huang bị các nhà phân tích hỏi về tiến trình của sức mạnh tính toán nội địa Trung Quốc tại cuộc họp phân tích của TSMC, câu trả lời lạnh lùng và rõ ràng: “Nếu họ thực sự có thể làm LLM thoát khỏi CUDA, đó sẽ là một thảm họa đối với chúng tôi.” Chín ngày sau, DeepSeek đã đưa ra câu trả lời bằng một thông báo Day 0.

Câu “Thay thế nội địa” trong ba năm qua đã bị lạm dụng đến mức mất ý nghĩa. Nhưng sau sáng ngày 24 tháng 4, lần đầu tiên có dữ liệu cụ thể để thị trường vốn định giá. Hiệu suất trên mỗi card, độ trễ suy luận cuối cùng, chi phí suy luận, mã triển khai có thể thương mại hóa, âm thầm đưa cuộc chiến ngôn từ kéo dài này vào ngưỡng sản xuất.

Logic tăng giá của cổ phiếu Cambrian 11 ngày liên tiếp chính là ở đây. Nó không còn là “cổ phiếu ý tưởng GPU nội địa”, mà là “nhà cung cấp hạ tầng suy luận V4”. Cũng có thể giải thích cho mức tăng 12% của cổ phiếu Huệ Hồng, vì họ gia công cho quy trình 7nm của 950PR. Mỗi token V4 chạy trên nội địa Ascend đều đồng nghĩa với việc phần nào công suất vốn đã dành cho Nvidia và TSMC bị giữ lại tại Vịnh Quảng Châu.

Và bước tiếp theo đã sẵn sàng. Trong lộ trình của Huawei, 950DT (phiên bản huấn luyện) dự kiến giao hàng vào quý IV năm 2026, mục tiêu là “đào tạo toàn bộ hệ thống mô hình V5 hoặc tương đương trên cụm 10.000 card”. Nếu con đường này thành công, hàng rào bảo vệ của CUDA trong đào tạo mô hình lớn Trung Quốc sẽ giảm từ “cần thiết” xuống “tùy chọn”.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim