Tin Gate News, ngày 24 tháng 4 — DeepSeek V4-Pro và DeepSeek V4-Flash đã được phát hành chính thức và công bố mã nguồn mở vào ngày 24 tháng 4; độ dài xử lý theo ngữ cảnh được mở rộng đáng kể từ 128K lên 1M, tương đương mức tăng dung lượng gần gấp 10 lần. Huawei Computing cho biết các sản phẩm siêu điểm nút (supernode) Ascend của họ hỗ trợ đầy đủ các mô hình thuộc dòng DeepSeek V4 thông qua sự hợp tác chặt chẽ giữa công nghệ chip và công nghệ mô hình.
Huawei Ascend 950 đạt triển khai suy luận mô hình DeepSeek V4 với thông lượng cao và độ trễ thấp nhờ các kỹ thuật kernel hợp nhất (fused kernel) và song song đa luồng (multi-stream parallelism) nhằm giảm chi phí tính toán Attention và chi phí truy cập bộ nhớ. Đối với DeepSeek V4-Pro với đầu vào 8K, Ascend 950 đạt khoảng 20ms TPOT với thông lượng Decode 4,700 TPS trên một thẻ đơn; đối với DeepSeek V4-Flash với đầu vào dưới 8K, nó đạt khoảng 10ms TPOT với thông lượng 1,600 TPS. Dòng siêu điểm nút (supernode) Ascend A3 cũng đạt tương thích hoàn toàn, kèm theo các triển khai mã huấn luyện mẫu để tinh chỉnh nhanh. Dựa trên siêu điểm nút 64 thẻ Ascend A3 với chế độ EP lớn, DeepSeek V4-Flash đạt hơn 2,000 TPS thông lượng Decode trên một thẻ đơn trong các tình huống đầu vào/đầu ra 8K/1K bằng cách sử dụng công cụ suy luận vLLM. Toàn bộ các dòng sản phẩm Huawei Ascend A2, A3 và 950 đều hỗ trợ cả DeepSeek V4-Flash và V4-Pro.
Huawei Cloud công bố khả năng tương thích theo phương thức “đi trước” với DeepSeek V4, cung cấp cho nhà phát triển dịch vụ token API chỉ với một lần nhấp thông qua nền tảng MaaS của họ. Huawei Cloud đã tối ưu năng lực của lớp hệ thống (system layer), lớp toán tử (operator layer) và lớp cụm (cluster layer) để đảm bảo thích nghi nhanh mô hình và triển khai hiệu năng cao. Các doanh nghiệp bao gồm Kingsoft WPS và 360 đã tích hợp mô hình mới của DeepSeek thông qua Huawei Cloud.
Cambricon cũng công bố tương thích “Day 0” với DeepSeek V4-Flash và V4-Pro dựa trên khung suy luận vLLM, đồng thời mã thích nghi được công bố mã nguồn mở cho cộng đồng GitHub. Cambricon trước đó cũng đã đạt khả năng thích nghi theo phương thức “đi trước” khi DeepSeek V3.2 được phát hành vào năm ngoái, nhờ đã thực hiện tối ưu hóa hiệu năng sâu về phần mềm-hardware (phần mềm–phần cứng) đồng tác giữa các mô hình thuộc dòng DeepSeek.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
OpenAI ra mắt giao thức mạng MRC với AMD, Intel, NVIDIA; hỗ trợ 100.000+ GPU
Theo thông báo của OpenAI vào ngày 6 tháng 5, công ty đã hợp tác với AMD, Broadcom, Intel, Microsoft và NVIDIA để ra mắt Multipath Reliable Connection (MRC), một giao thức mạng mở cho phép kết nối GPU trong các cụm huấn luyện AI quy mô lớn. Giao thức chia tách các lần truyền dữ liệu đơn lẻ trên
GateNews44phút trước
Cổ phiếu Hut 8 bật tăng 34% sau thương vụ cho thuê trung tâm dữ liệu AI trị giá 9,8 tỷ USD
Theo The Block, cổ phiếu của Hut 8 Corp. đã tăng 34% lên 107,87 USD trong phiên giao dịch trước giờ mở cửa hôm nay sau khi công ty ký một hợp đồng thuê trị giá 9,8 tỷ USD cho một khuôn viên trung tâm dữ liệu trí tuệ nhân tạo ở Nueces County, Texas, được thiết kế theo kiến trúc máy tính của NVIDIA. Thỏa thuận này là giai đoạn đầu tiên của Hu
GateNews1giờ trước
Giám đốc công nghệ của CleanSpark: Cơ sở hạ tầng AI/HPC cần nhiều tài nguyên mạng hơn so với khai thác Bitcoin
Theo một cuộc phỏng vấn của CoinDesk, Giám đốc Công nghệ của CleanSpark, Taylor Monnig, cho biết việc chuyển từ khai thác Bitcoin sang hạ tầng AI/HPC cần nhiều dự phòng hơn và ít ứng biến hơn. “Sợi quang mạng của một rack duy nhất vượt quá so với toàn bộ cơ sở khai thác Bitcoin,” Monnig
GateNews1giờ trước
Public mua nền tảng đầu tư AI Treasury App
Theo Foresight News, ứng dụng đầu tư Public đã công bố việc mua lại nền tảng đầu tư được hỗ trợ bởi AI Treasury App vào ngày 6/5. Số tiền mua lại không được tiết lộ. Thỏa thuận này nhằm củng cố hoạt động môi giới dựa trên AI của Public, hiện đang hỗ trợ cổ phiếu, trái phiếu và
GateNews1giờ trước
MiroMind dừng dịch vụ MiroThinker tại Đại Trung Hoa bắt đầu từ ngày 12 tháng 5
Theo BlockBeats, MiroMind, công ty nghiên cứu AI do nhà sáng lập của Shanda Group Chen Tianqiao thành lập, sẽ tạm dừng dịch vụ MiroThinker (phiên bản web và ứng dụng di động) tại Trung Quốc đại lục, Hồng Kông và Ma Cao bắt đầu từ ngày 12/5/2026. Ngày tạm dừng và lộ trình khôi phục đã được công bố thông qua
GateNews2giờ trước
ChatGPT ra mắt Excel và Google Sheets: GPT-5.5 đăng nhập trực tiếp vào bảng tính, Copilot và Gemini đối đầu ba bên
OpenAI ra mắt tiện ích ChatGPT for Excel và ChatGPT for Google Sheets, sử dụng công nghệ GPT-5.5, cốt lõi là vừa làm vừa giải thích. Tính năng bao gồm phân tích, tự động viết công thức, cập nhật bảng dữ liệu và diễn giải chi tiết từng bước quá trình suy luận, giúp người dùng có thể trực tiếp thao tác và hiểu ngay trong bảng tính. Cùng với Copilot và Gemini mở ra cuộc cạnh tranh ba bên, đánh dấu cục diện mới cho AI nâng cao năng suất doanh nghiệp; người dùng tại Đài Loan cần cài đặt qua AppSource/Workspace Marketplace và lưu ý quyền riêng tư dữ liệu cũng như liệu có cần ChatGPT Plus hay không.
ChainNewsAbmedia3giờ trước