ข้อความข่าว Gate ประจำวันที่ 24 เมษายน — DeepSeek V4-Pro และ DeepSeek V4-Flash ได้รับการปล่อยอย่างเป็นทางการและเปิดซอร์สเมื่อวันที่ 24 เมษายน โดยมีความยาวการประมวลผลบริบทเพิ่มขึ้นอย่างมีนัยสำคัญจาก 128K เป็น 1M ซึ่งคิดเป็นการเพิ่มความจุเกือบ 10 เท่า โดย Huawei Computing ประกาศว่า ผลิตภัณฑ์ซูเปอร์โหนด Ascend ของบริษัท รองรับโมเดลตระกูล DeepSeek V4 อย่างเต็มรูปแบบผ่านความร่วมมืออย่างใกล้ชิดระหว่างเทคโนโลยีชิปและโมเดล

Huawei Ascend 950 ทำให้การดีพลอยการอินเฟอเรนซ์ของโมเดล DeepSeek V4 มีอัตราการส่งผ่านสูงและหน่วงเวลาต่ำ โดยใช้เทคนิค fused kernel และ multi-stream parallelism เพื่อลดภาระการคำนวณ Attention และค่าใช้จ่ายในการเข้าถึงหน่วยความจำ สำหรับ DeepSeek V4-Pro เมื่อมีอินพุต 8K Ascend 950 ทำได้ประมาณ 20ms TPOT ด้วยอัตราการ Decode แบบ single-card 4,700 TPS; สำหรับ DeepSeek V4-Flash ภายใต้อินพุต 8K จะทำได้ประมาณ 10ms TPOT ด้วยทรูพุต 1,600 TPS Ascend A3 ซีรีส์ซูเปอร์โหนดยังทำได้เต็มรูปแบบเช่นกัน โดยมีการจัดเตรียมชุดอ้างอิงสำหรับการเทรนนิงเพื่อการ fine-tune ได้อย่างรวดเร็ว จากซูเปอร์โหนด Ascend A3 ขนาด 64 การ์ดที่มีโหมด large EP DeepSeek V4-Flash ทำได้มากกว่า 2,000 TPS ในการ Decode แบบ single-card สำหรับสถานการณ์อินพุต-เอาต์พุต 8K/1K โดยใช้เอนจินการอินเฟอเรนซ์ vLLM สายผลิตภัณฑ์ Ascend A2, A3 และ 950 ทั้งหมดของ Huawei รองรับทั้ง DeepSeek V4-Flash และ V4-Pro

Huawei Cloud ประกาศความเข้ากันได้แบบผู้มาก่อนได้เปรียบกับ DeepSeek V4 โดยให้บริการ API token แบบคลิกเดียวแก่ผู้พัฒนาผ่านแพลตฟอร์ม MaaS ของบริษัท Huawei Cloud ปรับความสามารถในเลเยอร์ระบบ เลเยอร์โอเปอเรเตอร์ และเลเยอร์คลัสเตอร์ให้เหมาะสม เพื่อให้มั่นใจว่าโมเดลสามารถปรับตัวได้อย่างรวดเร็วและทำการดีพลอยที่มีประสิทธิภาพสูง องค์กรต่างๆ รวมถึง Kingsoft WPS และ 360 ได้ผนวกรวมโมเดลใหม่ของ DeepSeek ผ่าน Huawei Cloud แล้ว

Cambricon ยังประกาศความเข้ากันได้ Day 0 กับ DeepSeek V4-Flash และ V4-Pro โดยอิงตามเฟรมเวิร์กการอินเฟอเรนซ์ vLLM โดยมีโค้ดสำหรับการปรับใช้เปิดซอร์สให้กับชุมชน GitHub Cambricon เคยทำสำเร็จในการปรับใช้แบบผู้มาก่อนได้เปรียบเช่นกันเมื่อ DeepSeek V3.2 เปิดตัวเมื่อปีที่แล้ว โดยได้ดำเนินการปรับปรุงสมรรถนะแบบร่วมมืออย่างลึกซึ้งระหว่างซอฟต์แวร์และฮาร์ดแวร์สำหรับโมเดลตระกูล DeepSeek

news.view.source

news.article.disclaimer

news.related.news

04-24 05:21

DeepSeek V4 จุดชนวนการถกเถียงในสหรัฐฯ: Think Tank ตั้งคำถามการใช้ชิป ขณะที่ซีอีโอ Replit ปกป้องนวัตกรรมแบบเปิด

04-24 04:49

DeepSeek V4 ทำคะแนนสมบูรณ์แบบบน Putnam-2025 เสมอกับ Axiom ในการให้เหตุผลทางคณิตศาสตร์แบบเป็นทางการ

04-24 04:29

V4-Pro ทำอัตราคะแนนผ่านการเขียนโค้ด 67% ในการทดสอบการใช้งานจริงภายใน ใกล้เคียงประสิทธิภาพ Opus 4.5

04-24 03:21

ข้อมูลการฝึกของ DeepSeek V4 เพิ่มเป็นสองเท่าเป็น 33T กระตุ้นความไม่เสถียรที่ทำให้การปล่อยล่าช้า

04-24 03:04