DeepSeek V4 เปิดตัวพร้อมหน้าต่างบริบท 1M; ชิป Huawei Ascend และ Cambricon ทำได้เต็มรูปแบบ

ข้อความข่าว Gate ประจำวันที่ 24 เมษายน — DeepSeek V4-Pro และ DeepSeek V4-Flash ได้รับการปล่อยอย่างเป็นทางการและเปิดซอร์สเมื่อวันที่ 24 เมษายน โดยมีความยาวการประมวลผลบริบทเพิ่มขึ้นอย่างมีนัยสำคัญจาก 128K เป็น 1M ซึ่งคิดเป็นการเพิ่มความจุเกือบ 10 เท่า โดย Huawei Computing ประกาศว่า ผลิตภัณฑ์ซูเปอร์โหนด Ascend ของบริษัท รองรับโมเดลตระกูล DeepSeek V4 อย่างเต็มรูปแบบผ่านความร่วมมืออย่างใกล้ชิดระหว่างเทคโนโลยีชิปและโมเดล

Huawei Ascend 950 ทำให้การดีพลอยการอินเฟอเรนซ์ของโมเดล DeepSeek V4 มีอัตราการส่งผ่านสูงและหน่วงเวลาต่ำ โดยใช้เทคนิค fused kernel และ multi-stream parallelism เพื่อลดภาระการคำนวณ Attention และค่าใช้จ่ายในการเข้าถึงหน่วยความจำ สำหรับ DeepSeek V4-Pro เมื่อมีอินพุต 8K Ascend 950 ทำได้ประมาณ 20ms TPOT ด้วยอัตราการ Decode แบบ single-card 4,700 TPS; สำหรับ DeepSeek V4-Flash ภายใต้อินพุต 8K จะทำได้ประมาณ 10ms TPOT ด้วยทรูพุต 1,600 TPS Ascend A3 ซีรีส์ซูเปอร์โหนดยังทำได้เต็มรูปแบบเช่นกัน โดยมีการจัดเตรียมชุดอ้างอิงสำหรับการเทรนนิงเพื่อการ fine-tune ได้อย่างรวดเร็ว จากซูเปอร์โหนด Ascend A3 ขนาด 64 การ์ดที่มีโหมด large EP DeepSeek V4-Flash ทำได้มากกว่า 2,000 TPS ในการ Decode แบบ single-card สำหรับสถานการณ์อินพุต-เอาต์พุต 8K/1K โดยใช้เอนจินการอินเฟอเรนซ์ vLLM สายผลิตภัณฑ์ Ascend A2, A3 และ 950 ทั้งหมดของ Huawei รองรับทั้ง DeepSeek V4-Flash และ V4-Pro

Huawei Cloud ประกาศความเข้ากันได้แบบผู้มาก่อนได้เปรียบกับ DeepSeek V4 โดยให้บริการ API token แบบคลิกเดียวแก่ผู้พัฒนาผ่านแพลตฟอร์ม MaaS ของบริษัท Huawei Cloud ปรับความสามารถในเลเยอร์ระบบ เลเยอร์โอเปอเรเตอร์ และเลเยอร์คลัสเตอร์ให้เหมาะสม เพื่อให้มั่นใจว่าโมเดลสามารถปรับตัวได้อย่างรวดเร็วและทำการดีพลอยที่มีประสิทธิภาพสูง องค์กรต่างๆ รวมถึง Kingsoft WPS และ 360 ได้ผนวกรวมโมเดลใหม่ของ DeepSeek ผ่าน Huawei Cloud แล้ว

Cambricon ยังประกาศความเข้ากันได้ Day 0 กับ DeepSeek V4-Flash และ V4-Pro โดยอิงตามเฟรมเวิร์กการอินเฟอเรนซ์ vLLM โดยมีโค้ดสำหรับการปรับใช้เปิดซอร์สให้กับชุมชน GitHub Cambricon เคยทำสำเร็จในการปรับใช้แบบผู้มาก่อนได้เปรียบเช่นกันเมื่อ DeepSeek V3.2 เปิดตัวเมื่อปีที่แล้ว โดยได้ดำเนินการปรับปรุงสมรรถนะแบบร่วมมืออย่างลึกซึ้งระหว่างซอฟต์แวร์และฮาร์ดแวร์สำหรับโมเดลตระกูล DeepSeek

news.article.disclaimer

btc.bar.articles

ผู้ใช้งานรายเดือน (MAU) ของแอป Claude พุ่งขึ้น 658% สู่ 85.79M ใน 1 ปี ขณะที่ยอดดาวน์โหลดเพิ่มขึ้น 2321%

จากข้อมูลของ Similarweb ที่จับตาดูโดย Beating พบว่าเมตริกแบบเทียบรายปีของ Claude App ในเดือนเมษายนเติบโตอย่างมีนัยสำคัญ โดยจำนวนผู้ใช้งานรายเดือน (MAU) เพิ่มจาก 11.31 ล้านเป็น 85.79 ล้าน เพิ่มขึ้น 658%; ส่วนยอดดาวน์โหลดจากแอปสโตร์พุ่งจาก 920,000 เป็น 22.3 ล้าน เพิ่มขึ้น 2321%

GateNews12 นาที ที่แล้ว

ประธาน OpenAI ให้การว่า มัสก์พยายามขอควบคุมทั้งหมดและ $800B สำหรับอาณานิคมดาวอังคาร เมื่อวันที่ 5 พฤษภาคม

ตามคำให้การของประธาน OpenAI อย่าง Greg Brokman เมื่อวันที่ 5 พฤษภาคมในสัปดาห์ที่ 2 ของการพิจารณาคดีในแคลิฟอร์เนีย อีลอน มัสก์เคยสนับสนุนให้แปลง OpenAI เป็นบริษัทแสวงหากำไร และเรียกร้องให้เขามีอำนาจควบคุมอย่างเต็มรูปแบบ โดย Brokeman ระบุว่า Musk อ้างถึงความจำเป็นในการระดมทุน 8 พันล้านดอลลาร์เพื่อ

GateNews13 นาที ที่แล้ว

Tessera Labs ปิดการระดมทุนรอบ Series A ที่นำโดย a16z; ทีม AI 6 คนเข้ามาแทนที่ที่ปรึกษา SAP จำนวน 60 ราย

ตามรายงานจาก Beating บริษัท Tessera Labs ซึ่งเป็นบริษัทบูรณาการระบบ AI ได้ปิดการระดมทุนรอบ Series A โดยมี a16z เป็นผู้นำการลงทุน สตาร์ทอัพดังกล่าวก่อตั้งขึ้นในปี 2024 ใช้แพลตฟอร์มแบบหลายเอเจนต์เพื่อทำให้การย้ายระบบจาก SAP ECC ไปยัง S/4HANA อัตโนมัติ ซึ่งโดยปกติแล้วต้องใช้เวลา 3-5 ปี และมูลค่า 100 ล้านดอลลาร์ ถึง 500 ล้านดอลลาร์ ต่อ

GateNews20 นาที ที่แล้ว

ประธานมูลนิธิ Liu กล่าวว่า Solana กำลังสร้างโครงสร้างการชำระเงินสำหรับเศรษฐกิจเครื่องจักรของ AI ที่ Consensus 2026

ในการประชุม Consensus Miami 2026 ประธานมูลนิธิ Solana อย่าง Lily Liu ได้โต้แย้งว่า การที่บริษัทต่างๆ เช่น Western Union นำเหรียญสเตเบิลคอยน์มาใช้ เป็นการยืนยันบทบาทของ Solana ในฐานะโครงสร้างพื้นฐานทางการเงินสำหรับทั้งเศรษฐกิจของมนุษย์และเศรษฐกิจของเครื่องจักร

GateNews1 ชั่วโมง ที่แล้ว

ตลาดไต้หวันรักษาระดับเหนือ 40,000 จุดได้แล้ว หุ้นสหรัฐฯ ทำสถิติสูงสุดใหม่ แต่ภาคอุตสาหกรรม AI เพิ่งเข้าสู่ระยะเริ่มต้น?

Goldman Sachs ระบุว่า ความต้องการ AI จะเพิ่มขึ้นอย่างมีนัยสำคัญจากการทำงานของ consumer agent ซึ่งจะดันให้การใช้โทเคนพุ่งสูง โดยในปี 2030 การเติบโตอาจมากกว่า 12 เท่า ปริมาณการคำนวณโทเคนต่อเดือนอาจแตะ 60 ล้านล้าน ขณะที่ความแตกต่างระหว่าง non-agent และ consumer agent อยู่ที่การทำงานอัตโนมัติแบบต่อเนื่องระยะยาว หากเป็นไปตามนั้น AI ก็จะเข้าสู่เวิร์กโฟลว์แบบ agentic Larry Fink กล่าวว่า อุปทานกำลังประมวลผลยังขาดแคลนอย่างรุนแรง และในอนาคตอาจเกิด “ฟิวเจอร์สด้านกำลังประมวลผล” ทั้งสองประเด็นร่วมกันเป็นแรงสนับสนุนฝั่งขาขึ้นสำหรับโครงสร้างพื้นฐานด้าน AI บทความมองว่า AI ยังอยู่ในช่วงเริ่มต้น

ChainNewsAbmedia1 ชั่วโมง ที่แล้ว

ผู้ให้บริการคลาวด์รายใหญ่ 9 ราย ปรับเพิ่มคำแนะนำการลงทุนด้านทุน (Capex) ปี 2026 เป็น 830 พันล้านดอลลาร์

ตามที่ TrendForce ระบุว่า ผู้ให้บริการคลาวด์รายใหญ่ 9 ราย ได้แก่ Google, Amazon Web Services, Meta, Microsoft, Oracle, ByteDance, Tencent, Alibaba และ Baidu ได้ปรับเพิ่มคำแนะนำการใช้จ่ายลงทุน (capital expenditure) รวมสำหรับปี 2026 เป็นประมาณ 830 พันล้านดอลลาร์ โดยได้รับแรงหนุนจากความต้องการ AI ที่แข็งแกร่ง การเติบโตจากปีก่อนหน้า r

GateNews1 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น