คนในวงการกล่าวว่า DeepSeek V4 จะเอาชนะ Claude และ ChatGPT ในด้านการเขียนโค้ด และจะเปิดตัวภายในไม่กี่สัปดาห์

Decrypt

สรุปโดยย่อ

  • DeepSeek V4 อาจเปิดตัวภายในไม่กี่สัปดาห์ โดยมุ่งเน้นประสิทธิภาพการเขียนโค้ดระดับสุดยอด
  • ผู้เชี่ยวชาญในวงการอ้างว่าอาจเอาชนะ Claude และ ChatGPT ในงานด้านโค้ดที่มีบริบทยาว
  • นักพัฒนากำลังเตรียมตัวล่วงหน้าก่อนการเปลี่ยนแปลงที่อาจเกิดขึ้น

DeepSeek รายงานว่ากำลังวางแผนเปิดตัวโมเดล V4 ในช่วงกลางเดือนกุมภาพันธ์ และถ้าการทดสอบภายในเป็นตัวบ่งชี้ใด ๆ สาย AI ของ Silicon Valley ควรจะรู้สึกกังวล สตาร์ทอัป AI ที่ตั้งอยู่ในหางโจวนี้อาจตั้งเป้าเปิดตัวในวันที่ 17 กุมภาพันธ์—วันตรุษจีนตามธรรมชาติ—ด้วยโมเดลที่ออกแบบมาเฉพาะสำหรับงานเขียนโค้ด ตามรายงาน The Information ผู้ที่มีความรู้โดยตรงเกี่ยวกับโครงการอ้างว่า V4 มีประสิทธิภาพดีกว่า Claude ของ Anthropic และซีรีส์ GPT ของ OpenAI ในการทดสอบภายใน โดยเฉพาะเมื่อจัดการกับคำสั่งโค้ดยาวมาก แน่นอนว่า ไม่มีการแชร์ข้อมูลหรือการทดสอบใด ๆ ของโมเดลนี้สาธารณะ จึงเป็นไปไม่ได้ที่จะตรวจสอบข้ออ้างเหล่านี้โดยตรง DeepSeek เองก็ไม่ได้ยืนยันข่าวลือเหล่านี้เช่นกัน

อย่างไรก็ตาม ชุมชนนักพัฒนาไม่ได้รอคำประกาศอย่างเป็นทางการ Reddit’s r/DeepSeek และ r/LocalLLaMA กำลังร้อนระอุ ผู้ใช้สะสมเครดิต API กันอย่างเต็มที่ และผู้สนใจบน X ก็รีบแบ่งปันการคาดการณ์ว่ารุ่น V4 อาจทำให้ DeepSeek กลายเป็นผู้ท้าทายที่ไม่ยอมแพ้ต่อกฎเกณฑ์พันล้านดอลลาร์ของ Silicon Valley

Anthropic บล็อกการสมัคร Claude ในแอปของบุคคลที่สามเช่น OpenCode และรายงานว่าหยุดการเข้าถึง xAI และ OpenAI แล้ว

Claude และ Claude Code ดีมาก แต่ยังไม่ดีกว่า 10 เท่า นี่จะผลักดันให้ห้องปฏิบัติการอื่นเร่งพัฒนารุ่น/เอเจนต์โค้ดของตนเองมากขึ้น

DeepSeek V4 คาดว่าจะเปิดตัว…

— Yuchen Jin (@Yuchenj_UW) 9 มกราคม 2026

นี่ไม่ใช่การเปลี่ยนแปลงครั้งแรกของ DeepSeek เมื่อบริษัทเปิดตัวโมเดลการให้เหตุผล R1 ในเดือนมกราคม 2025 มันได้กระตุ้นการขายออกในตลาดโลกเป็นมูลค่ากว่า $1 ล้านดอลลาร์ เหตุผล? R1 ของ DeepSeek ทำคะแนนเทียบเท่ากับโมเดล o1 ของ OpenAI ในการทดสอบด้านคณิตศาสตร์และการให้เหตุผล แม้ว่าจะใช้เงินเพียงประมาณ $6 ล้านในการพัฒนา—ซึ่งถูกกว่าคู่แข่งประมาณ 68 เท่า โมเดล V3 ของมันในภายหลังทำคะแนนได้ 90.2% ในการทดสอบ MATH-500 ซึ่งแซง Claude ที่ทำได้ 78.3% และอัปเดตล่าสุด “V3.2 Speciale” ก็ปรับปรุงประสิทธิภาพของมันให้ดีขึ้นอีกด้วย

ภาพ: DeepSeek

โฟกัสด้านการเขียนโค้ดของ V4 จะเป็นการเปลี่ยนกลยุทธ์อย่างมีนัยสำคัญ ในขณะที่ R1 เน้นการให้เหตุผลบริสุทธิ์—ตรรกะ คณิตศาสตร์ และการพิสูจน์ทางการ—V4 เป็นโมเดลแบบไฮบริด (ที่รวมการให้เหตุผลและงานที่ไม่ใช่การให้เหตุผล) ซึ่งมุ่งเป้าไปที่ตลาดนักพัฒนาระดับองค์กร ซึ่งการสร้างโค้ดที่มีความแม่นยำสูงจะส่งผลโดยตรงต่อรายได้ เพื่อครองความเป็นผู้นำ V4 จะต้องเอาชนะ Claude Opus 4.5 ซึ่งปัจจุบันถือสถิติ Verified ใน SWE-bench ที่ 80.9% แต่ถ้าดูจากการเปิดตัวในอดีตของ DeepSeek ก็อาจไม่ใช่เรื่องที่เป็นไปไม่ได้ แม้จะมีข้อจำกัดต่าง ๆ ที่ห้องปฏิบัติการ AI จีนต้องเผชิญ ซอสลับไม่ลับ สมมุติว่าข่าวลือเป็นจริง แล้วห้องปฏิบัติการเล็ก ๆ นี้จะทำเช่นนี้ได้อย่างไร? อาวุธลับของบริษัทอาจอยู่ในเอกสารวิจัยเมื่อวันที่ 1 มกราคม: Manifold-Constrained Hyper-Connections หรือ mHC ซึ่งร่วมเขียนโดยผู้ก่อตั้ง Liang Wenfeng วิธีการฝึกใหม่นี้แก้ปัญหาพื้นฐานในการขยายขนาดโมเดลภาษาใหญ่—ว่าจะขยายความสามารถของโมเดลโดยไม่ให้มันเสถียรภาพลดลงหรือระเบิดระหว่างการฝึก โครงสร้าง AI แบบดั้งเดิมบังคับให้ข้อมูลทั้งหมดผ่านเส้นทางแคบเส้นเดียว mHC ขยายเส้นทางนั้นเป็นหลายสตรีมที่สามารถแลกเปลี่ยนข้อมูลกันได้โดยไม่ทำให้การฝึกหยุดชะงัก

ภาพ: DeepSeek

Wei Sun นักวิเคราะห์หลักด้าน AI จาก Counterpoint Research เรียก mHC ว่าเป็น “ความก้าวหน้าที่น่าทึ่ง” ในคำให้สัมภาษณ์กับ Business Insider เทคนิคนี้แสดงให้เห็นว่า DeepSeek สามารถ “หลีกเลี่ยงคอขวดด้านการคำนวณและปลดล็อกความก้าวหน้าในด้านปัญญา” แม้จะมีการเข้าถึงชิปขั้นสูงจำกัดเนื่องจากข้อจำกัดการส่งออกของสหรัฐฯ Lian Jye Su นักวิเคราะห์อาวุโสจาก Omdia ชี้ให้เห็นว่าความเต็มใจของ DeepSeek ที่จะเผยแพร่วิธีการของตนเป็นสัญญาณของ “ความมั่นใจใหม่ในอุตสาหกรรม AI ของจีน” วิธีการเปิดเผยของบริษัททำให้กลายเป็นที่ชื่นชอบในหมู่นักพัฒนาที่มองว่าเป็นตัวแทนของสิ่งที่ OpenAI เคยเป็น ก่อนที่จะเปลี่ยนไปใช้โมเดลปิดและรอบระดมทุนพันล้านดอลลาร์ 

แต่ไม่ใช่ทุกคนจะเชื่อมั่น บางนักพัฒนาบน Reddit บ่นว่าโมเดลการให้เหตุผลของ DeepSeek ใช้คำนวณบนงานง่าย ๆ ในขณะที่นักวิจารณ์อ้างว่ามาตรฐานของบริษัทไม่สะท้อนความซับซ้อนในโลกจริง โพสต์บน Medium ชื่อ “DeepSeek แย่—และฉันก็เลิกแกล้งทำเป็นไม่รู้” กลายเป็นไวรัลในเดือนเมษายน 2025 กล่าวหาว่าโมเดลสร้าง “เนื้อหามาตรฐานที่มีบั๊ก” และ “ไลบรารีที่ hallucinated” DeepSeek ก็มีภาระบ้าง ความกังวลด้านความเป็นส่วนตัวเป็นปัญหากับบริษัท โดยบางรัฐบาลก็ห้ามใช้แอปพลิเคชันพื้นเมืองของ DeepSeek ความสัมพันธ์ของบริษัทกับจีนและคำถามเกี่ยวกับการเซ็นเซอร์ในโมเดลของมันเพิ่มความตึงเครียดทางภูมิรัฐศาสตร์ในการถกเถียงด้านเทคนิค อย่างไรก็ตาม โมเมนตัมนี้เป็นสิ่งที่ปฏิเสธไม่ได้ DeepSeek ได้รับการนำไปใช้ในเอเชียอย่างแพร่หลาย และถ้า V4 สามารถทำตามสัญญาเรื่องการเขียนโค้ดได้ การนำไปใช้ในภาคธุรกิจในตะวันตกก็อาจตามมา

ภาพ: Microsoft

ยังมีเรื่องเวลาที่เหมาะสมด้วย ตามรายงาน Reuters DeepSeek เคยวางแผนเปิดตัวโมเดล R2 ในเดือนพฤษภาคม 2025 แต่ขยายเวลาการเปิดตัวหลังจากผู้ก่อตั้ง Liang ไม่พอใจกับผลการดำเนินงาน ตอนนี้ ด้วย V4 ที่คาดว่าจะเปิดตัวในกุมภาพันธ์ และ R2 อาจตามมาในเดือนสิงหาคม บริษัทกำลังดำเนินไปอย่างรวดเร็ว ซึ่งบ่งบอกถึงความเร่งด่วน—หรือความมั่นใจ อาจเป็นทั้งสองอย่าง

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น