DeepSeek เปิดตัวโมเดล V4-Pro และ V4-Flash ในต้นทุนที่ต่ำกว่า GPT-5.5 Pro ของ OpenAI ถึง 98%

ข่าวประตูเมือง ประจำวันที่ 25 เมษายน — DeepSeek ปล่อยตัวอย่าง (preview) ของ V4-Pro และ V4-Flash เมื่อวันที่ 24 เมษายน ทั้งสองเป็นโมเดลน้ำหนักเปิด (open-weight) ที่มีหน้าต่างคอนเท็กซ์ 1 ล้านโทเค็น V4-Pro มีพารามิเตอร์ทั้งหมด 1.6 ล้านล้านตัว แต่จะเปิดใช้งานได้เพียง 49 พันล้านต่อรอบการอินเฟอเรนซ์ผ่านสถาปัตยกรรมแบบ Mixture-of-Experts V4-Flash มีพารามิเตอร์ทั้งหมด 284 พันล้านตัว โดยมีที่ใช้งานจริง 13 พันล้านตัว

ราคาถูกกว่าคู่แข่งอย่างมีนัยสำคัญ: V4-Pro มีค่าใช้จ่าย $1.74 ต่อ 1 ล้านโทเค็นสำหรับอินพุต และ $3.48 ต่อ 1 ล้านโทเค็นสำหรับเอาต์พุต—ประมาณ 98% น้อยกว่าของ GPT-5.5 Pro ของ OpenAI ($30 input, $180 output) และมีค่าใช้จ่ายราวหนึ่งในยี่สิบของต้นทุน Claude Opus 4.7 V4-Flash มีราคาที่ $0.14 สำหรับอินพุต และ $0.28 สำหรับเอาต์พุต ต่อ 1 ล้านโทเค็น ทั้งสองโมเดลเป็นโอเพนซอร์สภายใต้ไลเซนส์ MIT และสามารถรันในเครื่องได้ฟรี

DeepSeek ทำให้มีประสิทธิภาพดีขึ้นผ่านกลไกความสนใจ (attention) แบบใหม่สองแบบ: Compressed Sparse Attention และ Heavily Compressed Attention ซึ่งลดต้นทุนการคำนวณเหลือ 27% ของรุ่นก่อนหน้าของ V4-Pro (V3.2) และเหลือ 10% สำหรับ V4-Flash บริษัทฝึก V4 บางส่วนบนชิป Huawei Ascend โดยหลีกเลี่ยงข้อจำกัดการส่งออกของสหรัฐฯ ที่มีต่อโปรเซสเซอร์ Nvidia รุ่นที่ก้าวหน้า DeepSeek ระบุว่าเมื่อซูเปอร์โหนดใหม่ 950 เครื่องทยอยออนไลน์ในช่วงปลายปี 2026 ราคาจะลดลงอีก

ด้านผลการทดสอบประสิทธิภาพ V4-Pro-Max อยู่อันดับหนึ่งบน Codeforces สำหรับการแข่งขันเขียนโปรแกรม (3,206 คะแนน โดยอยู่ราวอันดับที่ 23 ในกลุ่มผู้เข้าแข่งขันที่เป็นมนุษย์) และได้คะแนน 90.2% ในโจทย์คณิตศาสตร์ Apex Shortlist เทียบกับ Claude Opus 4.6 ที่ได้ 85.9% อย่างไรก็ตาม มันตามหลังในเกณฑ์การทดสอบด้านมัลติทาสกิ้ง: MMLU-Pro (87.5% เทียบกับ Gemini-3.1-Pro ที่ 91.0%) และ Humanity’s Last Exam (37.7% เทียบกับ 44.4%) สำหรับงานที่ต้องใช้คอนเท็กซ์ยาว V4-Pro นำหน้าโมเดลโอเพนซอร์ส แต่แพ้ Claude Opus 4.6 ในการทดสอบการดึงข้อมูล MRCR

V4-Pro เพิ่ม “interleaved thinking” ซึ่งทำให้เวิร์กโฟลว์ของเอเจนต์สามารถคงบริบทการให้เหตุผลไว้ได้ข้ามการเรียกใช้เครื่องมือหลายครั้ง โดยไม่ต้องล้างระหว่างขั้น ทั้งสองโมเดลรองรับการเชื่อมต่อการเขียนโค้ดกับ Claude Code และ OpenCode ตามแบบสำรวจสำหรับนักพัฒนาของ DeepSeek จากผู้ใช้ 85 คน 52% กล่าวว่า V4-Pro พร้อมใช้งานเป็นเอเจนต์โค้ดเริ่มต้นของพวกเขา โดย 39% เอนเอียงไปทางการนำไปใช้ เอนด์พอยต์ deepseek-chat และ deepseek-reasoner รุ่นเดิมจะยุติการให้บริการในวันที่ 24 กรกฎาคม 2026

news.article.disclaimer

btc.bar.articles

Anthropic เปิดตัว Claude Dreams: เอเจนต์จัดระเบียบหน่วยความจำให้เองระหว่างทำงาน ขจัดความซ้ำซ้อนและความขัดแย้ง

Anthropic ในงาน Code with Claude เปิดตัว Dreams โดยให้ Claude Managed Agents จัดระเบียบความจำโดยอัตโนมัติระหว่างหลายรอบการสนทนา ขจัดข้อมูลซ้ำและความขัดแย้ง อัปเดตรายการที่ล้าสมัย และสร้างคลังความจำหลังการจัดระเบียบที่ตรวจสอบได้ ขีดจำกัดอินพุตอยู่ที่ 100 session และ 4,096 ตัวอักษร ทำงานแบบอะซิงโครนัส ใช้เวลาไม่กี่นาทีถึงหลายสิบนาทีเสร็จสิ้น รองรับการสังเกตแบบสตรีม ทั้งนี้ต้องสมัครเพื่อดูตัวอย่างงานวิจัย ปัจจุบันรองรับเฉพาะ claude-opus-4-7 และ claude-sonnet-4-6 ยังไม่มีการกำหนดวันเปิดตัวอย่างเป็นทางการ

ChainNewsAbmedia37 นาที ที่แล้ว

Anthropic จับมือ SpaceX ด้านกำลังประมวลผล: คว้า Colossus 1 ทั้งระบบ 220,000 GPU, Claude ปลดเพดานการใช้งาน

Anthropic ประกาศจับมือด้านกำลังประมวลผลกับ SpaceX สำหรับดาตาเซ็นเตอร์ Colossus 1 โดยจะระดมใช้ GPU ของ Nvidia มากกว่า 220,000 ชิ้น และความจุเกิน 300MW คาดว่าจะติดตั้งให้แล้วเสร็จภายใน 1 เดือนเพื่อให้ Anthropic ใช้งานทั้งหมด พร้อมยกระดับประสิทธิภาพและประสบการณ์ของ Claude และ Code ขณะเดียวกันยังผ่อนคลายเพดานการใช้งานราย 5 ชั่วโมงของ Pro/Max/Team/Enterprise ยกเลิกขีดจำกัดช่วงพีค และเพิ่มอัตราเร่งของ Opus API การขยายโครงสร้างพื้นฐานในเอเชียและยุโรปเกิดขึ้นควบคู่กันไปด้วย โดยในอนาคตยังมีแนวโน้มโครงการอย่าง “การคำนวณด้วย AI ในวงโคจร” แต่ยังไม่ได้มีการทำสัญญา

ChainNewsAbmedia48 นาที ที่แล้ว

วิศวกรของ Coinbase: เอเจนต์ AI อาจพลิกโฉมโมเดลการโฆษณาในเว็บ

เอริก เรเพลล์ วิศวกรของ Coinbase กล่าวว่า เอเจนต์ปัญญาประดิษฐ์อาจทำให้รูปแบบธุรกิจของอินเทอร์เน็ตที่พึ่งพารายได้จากโฆษณาถูกบั่นทอนอย่างพื้นฐานได้ ตามที่เรเพลล์กล่าวว่า เศรษฐกิจบนเว็บพึ่งพารายได้จากโฆษณาที่เกิดจากผู้ใช้งานมนุษย์เป็นอย่างมาก แต่เอเจนต์ AI สามารถข้ามระบบนั้นไปได้

CryptoFrontier1 ชั่วโมง ที่แล้ว

Anthropic เพิ่มขีดจำกัดอัตรา (rate limits) ของ Claude Code เป็นสองเท่า หลังจากทำข้อตกลงกับ SpaceX เพื่อให้ได้กำลังการผลิต 300MW จากอวกาศ

ตามรายงานของ Odaily แอนโทรปิก (Anthropic) ได้ลงนามข้อตกลงกับ SpaceX เพื่อเข้าถึงกำลังประมวลผลเต็มรูปแบบของศูนย์ข้อมูล Colossus 1 โดยสามารถจัดหากำลังใหม่ได้มากกว่า 300 เมกะวัตต์ และมากกว่า 220,000 หน่วย GPU ของ NVIDIA ภายในเดือนนี้ ตั้งแต่มีผลทันที ขีดจำกัดอัตราค่าบริการของ Claude Code แบบ Pro ที่จำกัดไว้ทุก 5 ชั่วโมงของ

GateNews1 ชั่วโมง ที่แล้ว

OpenAI เปิดเผยโปรโตคอลเครือข่ายซูเปอร์คอมพิวเตอร์ MRC! ร่วมมือกับ Nvidia, AMD และ Microsoft เพื่อสร้างโครงสร้างพื้นฐานของ Stargate

OpenAI เผยแพร่ข้อตกลงโครงข่ายสำหรับซูเปอร์คอมพิวเตอร์ AI MRC ร่วมมือกับ AMD, Microsoft, NVIDIA และอื่นๆ พร้อมเปิดซอร์สบน OCP โดย MRC จะแบ่งข้อมูลและส่งผ่านหลายเส้นทางพร้อมกัน หลีกเลี่ยงสิ่งกีดขวางระดับไมโครวินาที ลดความแออัด รักษาการซิงก์ของ GPU และแก้ปัญหาคอขวดด้านการส่งข้อมูลในคลัสเตอร์การฝึกขนาดใหญ่ ฐานปฏิบัติการอย่าง Stargate ในเมือง Abilene รัฐเท็กซัส ได้ติดตั้งอินเทอร์เฟซ 800Gb/s และนำไปใช้ในการฝึกจริงแล้ว

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

แพลตฟอร์มสรรหาบุคลากรด้วย AI Ethos ปิดรอบระดมทุน Series A มูลค่า 22.75 ล้านดอลลาร์ โดยมี a16z เป็นผู้นำ เมื่อวันที่ 6 พฤษภาคม

ตามรายงานของ BlockBeats แพลตฟอร์มสรรหาบุคลากรด้าน AI ที่ตั้งอยู่ในลอนดอน Ethos ปิดการระดมทุนรอบ Series A มูลค่า 22.75 ล้านดอลลาร์เมื่อวันที่ 6 พฤษภาคม โดย Andreessen Horowitz (a16z) เป็นผู้นำรอบ และ General Catalyst เข้าร่วม การแพลตฟอร์มใช้ AI ในการสัมภาษณ์ผู้สมัครและวิเคราะห์

GateNews3 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น