คนในวงการกล่าวว่า DeepSeek V4 จะเอาชนะ Claude และ ChatGPT ในด้านการเขียนโค้ด และจะเปิดตัวภายในไม่กี่สัปดาห์

Decrypt

2026-01-11 21:01:09

สรุปโดยย่อ

DeepSeek V4 อาจเปิดตัวภายในไม่กี่สัปดาห์ โดยมุ่งเน้นประสิทธิภาพการเขียนโค้ดระดับสุดยอด
ผู้เชี่ยวชาญในวงการอ้างว่าอาจเอาชนะ Claude และ ChatGPT ในงานด้านโค้ดที่มีบริบทยาว
นักพัฒนากำลังเตรียมตัวล่วงหน้าก่อนการเปลี่ยนแปลงที่อาจเกิดขึ้น

DeepSeek รายงานว่ากำลังวางแผนเปิดตัวโมเดล V4 ในช่วงกลางเดือนกุมภาพันธ์ และถ้าการทดสอบภายในเป็นสิ่งบ่งชี้ใด ๆ สาย AI ของซิลิคอนวัลเลย์ควรจะรู้สึกกังวล สตาร์ทอัปด้าน AI ที่ตั้งอยู่ในหางโจวนี้อาจตั้งเป้าเปิดตัวในวันที่ 17 กุมภาพันธ์ ซึ่งเป็นวันตรุษจีนตามธรรมชาติ พร้อมโมเดลที่ออกแบบมาเฉพาะสำหรับงานเขียนโค้ด ตามรายงาน The Information ผู้ที่มีความรู้โดยตรงเกี่ยวกับโครงการอ้างว่า V4 มีประสิทธิภาพดีกว่า Claude ของ Anthropic และซีรีส์ GPT ของ OpenAI ในการทดสอบภายใน โดยเฉพาะเมื่อจัดการกับคำสั่งโค้ดยาวมาก แน่นอนว่า ไม่มีการแชร์ข้อมูลหรือการทดสอบใด ๆ ของโมเดลนี้สาธารณะ จึงเป็นไปไม่ได้ที่จะตรวจสอบข้ออ้างดังกล่าวโดยตรง DeepSeek เองก็ไม่ได้ยืนยันข่าวลือเหล่านี้เช่นกัน

อย่างไรก็ตาม ชุมชนนักพัฒนาไม่ได้รอคำประกาศอย่างเป็นทางการ Reddit’s r/DeepSeek และ r/LocalLLaMA กำลังคึกคัก ผู้ใช้สะสมเครดิต API กันอย่างเต็มที่ และผู้สนใจบน X ก็รีบแบ่งปันการคาดการณ์ว่ารุ่น V4 อาจยืนยันตำแหน่งของ DeepSeek ในฐานะผู้มาแรงที่ไม่ยอมเล่นตามกฎของซิลิคอนวัลเลย์ที่มีมูลค่าพันล้านดอลลาร์

Anthropic บล็อกการสมัคร Claude ในแอปของบุคคลที่สาม เช่น OpenCode และรายงานว่าหยุดการเข้าถึง xAI และ OpenAI แล้ว

Claude และ Claude Code ดีมาก แต่ยังไม่ดีกว่า 10 เท่า นี่จะผลักดันให้ห้องปฏิบัติการอื่นเร่งพัฒนารุ่น/เอเจนต์โค้ดของพวกเขา

DeepSeek V4 คาดว่าจะเปิดตัว…

— Yuchen Jin (@Yuchenj_UW) 9 มกราคม 2026

นี่ไม่ใช่การเปลี่ยนแปลงครั้งแรกของ DeepSeek เมื่อบริษัทเปิดตัวโมเดลการให้เหตุผล R1 ในเดือนมกราคม 2025 มันสร้างความตกใจในตลาดโลกถึง $1 ล้านล้านดอลลาร์ เหตุผลคืออะไร? R1 ของ DeepSeek ทำคะแนนเทียบเท่ากับโมเดล o1 ของ OpenAI ในการทดสอบด้านคณิตศาสตร์และการให้เหตุผล แม้ว่าจะรายงานว่ามีค่าใช้จ่ายเพียง $6 ล้านดอลลาร์ในการพัฒนา—ถูกกว่าคู่แข่งประมาณ 68 เท่า โมเดล V3 ของมันต่อมาได้คะแนน 90.2% ในการทดสอบ MATH-500 ซึ่งแซง Claude ที่ 78.3% และอัปเดตล่าสุด “V3.2 Speciale” ก็ปรับปรุงประสิทธิภาพของมันให้ดีขึ้นอีกด้วย

ภาพ: DeepSeek

โฟกัสด้านการเขียนโค้ดของ V4 จะเป็นการเปลี่ยนกลยุทธ์อย่างมีนัยสำคัญ ในขณะที่ R1 เน้นการให้เหตุผลบริสุทธิ์—ตรรกะ คณิตศาสตร์ การพิสูจน์ทางการ—V4 เป็นโมเดลแบบไฮบริด (การให้เหตุผลและงานที่ไม่ใช่การให้เหตุผล) ซึ่งมุ่งเป้าไปที่ตลาดนักพัฒนาระดับองค์กรที่การสร้างโค้ดที่มีความแม่นยำสูงสามารถแปลเป็นรายได้โดยตรง เพื่อครองความเป็นผู้นำ V4 จะต้องเอาชนะ Claude Opus 4.5 ซึ่งปัจจุบันถือสถิติ Verified ใน SWE-bench ที่ 80.9% แต่ถ้าพิจารณาจากการเปิดตัวในอดีตของ DeepSeek ก็อาจไม่ใช่เรื่องที่เป็นไปไม่ได้ แม้จะมีข้อจำกัดต่าง ๆ ที่ห้องปฏิบัติการ AI จีนต้องเผชิญ ซอสลับไม่ลับ สมมติว่าข่าวลือเป็นความจริง แล้วห้องปฏิบัติการเล็ก ๆ นี้จะทำเช่นนี้ได้อย่างไร? อาวุธลับของบริษัทอาจอยู่ในเอกสารวิจัยเมื่อวันที่ 1 มกราคม: Manifold-Constrained Hyper-Connections หรือ mHC ซึ่งร่วมเขียนโดยผู้ก่อตั้ง Liang Wenfeng วิธีการฝึกใหม่นี้แก้ปัญหาพื้นฐานในการขยายขนาดโมเดลภาษาใหญ่—ว่าจะขยายความสามารถของโมเดลโดยไม่ให้มันเสถียรหรือระเบิดระหว่างการฝึก โครงสร้าง AI แบบดั้งเดิมบังคับให้ข้อมูลทั้งหมดผ่านเส้นทางแคบเส้นเดียว mHC ขยายเส้นทางนั้นเป็นหลายสตรีมที่สามารถแลกเปลี่ยนข้อมูลกันได้โดยไม่ทำให้การฝึกหยุดชะงัก

ภาพ: DeepSeek

Wei Sun นักวิเคราะห์หลักด้าน AI จาก Counterpoint Research เรียก mHC ว่าเป็น “ความก้าวหน้าที่น่าทึ่ง” ในคำให้สัมภาษณ์กับ Business Insider เทคนิคนี้ เธอกล่าวว่า แสดงให้เห็นว่า DeepSeek สามารถ “หลีกเลี่ยงคอขวดในการคำนวณและปลดล็อกความก้าวหน้าในด้านปัญญา” แม้จะมีการเข้าถึงชิปขั้นสูงจำกัดเนื่องจากข้อจำกัดการส่งออกของสหรัฐ Lian Jye Su นักวิเคราะห์อาวุโสจาก Omdia สังเกตว่าความเต็มใจของ DeepSeek ที่จะเผยแพร่วิธีการของตนเป็นสัญญาณของ “ความมั่นใจใหม่ในอุตสาหกรรม AI ของจีน” วิธีการเปิดเผยของบริษัททำให้กลายเป็นที่ชื่นชอบในหมู่นักพัฒนาที่มองว่าเป็นตัวแทนของสิ่งที่ OpenAI เคยเป็น ก่อนที่จะเปลี่ยนไปใช้โมเดลปิดและรอบระดมทุนพันล้านดอลลาร์

แต่ไม่ใช่ทุกคนจะเชื่อมั่น บางนักพัฒนาบน Reddit บ่นว่าโมเดลการให้เหตุผลของ DeepSeek ใช้พลังคำนวณไปกับงานง่าย ๆ ในขณะที่นักวิจารณ์อ้างว่ามาตรฐานของบริษัทไม่สะท้อนความซับซ้อนในโลกความเป็นจริง โพสต์บน Medium ชื่อ “DeepSeek แย่—และฉันก็เลิกแกล้งทำเป็นไม่รู้สึก” กลายเป็นไวรัลในเดือนเมษายน 2025 กล่าวหาว่าโมเดลสร้าง “เนื้อหามาตรฐานที่มีบั๊ก” และ “ไลบรารีที่ hallucinated” DeepSeek ยังมีภาระบ้าง ความกังวลด้านความเป็นส่วนตัวเป็นปัญหากับบริษัท โดยบางรัฐบาลก็ห้ามใช้แอปพลิเคชันพื้นเมืองของ DeepSeek ความสัมพันธ์ของบริษัทกับจีนและคำถามเกี่ยวกับการเซ็นเซอร์ในโมเดลของมันเพิ่มความตึงเครียดทางภูมิรัฐศาสตร์ในการถกเถียงด้านเทคนิค อย่างไรก็ตาม โมเมนตัมนี้เป็นสิ่งที่ปฏิเสธไม่ได้ DeepSeek ได้รับการนำไปใช้ในเอเชียอย่างแพร่หลาย และถ้า V4 สามารถทำตามสัญญาเรื่องการเขียนโค้ดได้ การนำไปใช้ในภาคธุรกิจในตะวันตกก็อาจตามมา

ภาพ: Microsoft

ยังมีเรื่องเวลาอีกด้วย ตามรายงาน Reuters DeepSeek เคยวางแผนเปิดตัวโมเดล R2 ในเดือนพฤษภาคม 2025 แต่ขยายเวลาการเปิดตัวหลังจากผู้ก่อตั้ง Liang ไม่พอใจกับผลการดำเนินงาน ตอนนี้ ด้วย V4 ที่คาดว่าจะเปิดตัวในกุมภาพันธ์ และ R2 อาจตามในเดือนสิงหาคม บริษัทกำลังดำเนินไปอย่างรวดเร็ว ซึ่งบ่งบอกถึงความเร่งด่วน—หรือความมั่นใจ บางทีทั้งสองอย่าง

ดูต้นฉบับ

news.article.disclaimer

แสดงความคิดเห็น

0/400

00001cl

· 01-15 04:46

อีกแล้วที่นำห่างไปไกล

ดูต้นฉบับตอบกลับ0