DeepSeek และ Xiaomi ปรับลดราคามodel AI ลงสูงสุด 99% ขณะที่แล็บในสหรัฐเพิ่มต้นทุน

OliverGrant

DeepSeek และ Xiaomi ลดราคาค่า API ขณะที่ห้องแล็บของสหรัฐฯ ปรับขึ้นอัตรา

DeepSeek ทำส่วนลด 75% ของ DeepSeek V4-Pro ให้เป็นแบบถาวรตั้งแต่วันที่ 22 พฤษภาคม 2026 โดยล็อกราคาการสร้างผลลัพธ์ไว้ที่ 0.87 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น Xiaomi ทำตามในวันที่ 26 พฤษภาคม โดยปรับลดราคาค่า API ของ MiMo-V2.5 ลงได้สูงสุด 99% สำหรับอินพุตแบบแคช และรุ่น Pro ตอนนี้อยู่ที่ 0.0036 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นสำหรับอินพุตแบบแคช การลดราคานี้มาจากการปรับแต่งทางเทคนิคในเฟรมเวิร์กสำหรับการอินเฟอเรนซ์และสถาปัตยกรรม KV cache การปรับลดเหล่านี้เกิดขึ้นในช่วงเดียวกับที่ OpenAI เพิ่มราคาผลลัพธ์ของ GPT-5.5 เป็น 2 เท่าตัวเป็น 30 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นตั้งแต่เปิดตัวปลายเดือนเมษายน และ Anthropic ส่ง Claude Opus 4.7 พร้อมตัวตอกใหม่ (tokenizer) ที่สร้างได้มากถึง 35% ของโทเค็นเพิ่มเติมสำหรับข้อความอินพุตชุดเดิม ซึ่งอาจทำให้ต้นทุนที่แท้จริงสูงขึ้น แม้ตารางราคา (rate cards) จะไม่เปลี่ยน

ประกาศการเปลี่ยนแปลงราคาที่เป็นแบบถาวร

DeepSeek V4-Pro ตอนนี้อยู่ที่ 0.435 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นสำหรับอินพุต และ 0.87 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นสำหรับเอาต์พุต ส่วนลด 75% ที่ก่อนหน้านี้กำหนดจะหมดอายุ ถูกทำให้เป็นแบบถาวรมาก่อนในสัปดาห์นี้ Xiaomi's MiMo-V2.5-Pro ตรงตามราคาเดียวกันที่ 0.435/0.87 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นหลังการปรับลดในวันที่ 26 พฤษภาคม สำหรับ MiMo-V2.5 ค่าแคชฮิตลดลงเหลือ 0.0036 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น การอัปเกรดด้านการเรียกเก็บเงินของ Xiaomi ทำให้ผู้ใช้ได้โทเค็นมากขึ้น 5 ถึง 8 เท่าในราคาเดิม แผน Max ที่ 100 ดอลลาร์สหรัฐ ตอนนี้ให้โทเค็น 82 พันล้านโทเค็น จากเดิม 1.6 พันล้าน

กลไกทางเทคนิคเบื้องหลังการลดราคา

Fuli Luo หัวหน้าทีม MiMo ของ Xiaomi และอดีตนักพัฒนา DeepSeek ระดับแกนหลักซึ่งร่วมสร้าง DeepSeek-V2 เผยแพร่คำอธิบายทางเทคนิคบน X ในวันที่ 27 พฤษภาคม เฟรมเวิร์กการอินเฟอเรนซ์รองรับการเพิ่มประสิทธิภาพ KV cache แบบลำดับชั้นสำหรับ SWA การทดสอบเครื่องมืออินเฟอเรนซ์ในระดับการผลิตชี้ว่าการเพิ่มประสิทธิภาพนี้เพิ่มความจุของโทเค็นที่ถูกแคชได้ประมาณ 5 เท่า ระบบลดต้นทุนด้านการจัดเก็บและการประมวลผลลงราว 80% “เมื่อรันในราคาค่า API ที่ลดลงใหม่ เครื่องมืออินเฟอเรนซ์ในระดับการผลิตของเราทำงานใกล้เต็มกำลัง และเรายังสามารถทำให้คุ้มทุนได้แทบทั้งหมด” Luo เขียนไว้

DeepSeek V4 ใช้การให้ความสนใจ (attention) แบบสลับกัน 2 ประเภท: แบบหนึ่งบีบอัดทุก 4 โทเค็นสำหรับ selective attention และอีกแบบยุบทุก 128 โทเค็นสำหรับบริบทส่วนรวม เมื่อบริบทอยู่ที่หนึ่งล้านโทเค็น KV cache ของ V4-Pro มีขนาดแค่ 10% ของรุ่นก่อน การอินเฟอเรนซ์แบบทีละโทเค็นใช้ต้นทุนคอมพิวต์เพียง 27% ของเดิม

เกณฑ์วัดประสิทธิภาพและการเทียบราคา

DeepSeek V4-Pro ทำคะแนน 80.6% บน SWE-Verified Claude Opus 4.6 ทำ 80.8% บนเกณฑ์เดียวกันที่วัดการแก้ไขปัญหา GitHub อย่างแท้จริง ช่องว่างด้านราคาระหว่างสองโมเดล: 34x สำหรับเอาต์พุต DeepSeek V4-Pro เป็นโมเดลพารามิเตอร์ 1.6 ล้านล้าน

Claude Opus 4.7 มีค่าใช้จ่าย 5 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นสำหรับอินพุต และ 25 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นสำหรับเอาต์พุต GPT-5.5 อยู่ที่ 30 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็นสำหรับเอาต์พุต เพิ่มเป็น 2 เท่าจากอัตราของรุ่นก่อน Gemini 2.5 Pro อยู่ที่ 1.25 ดอลลาร์สหรัฐสำหรับอินพุต และ 10 ดอลลาร์สหรัฐสำหรับเอาต์พุตต่อหนึ่งล้านโทเค็น

MiniMax M2.7 มีค่า 0.30 ดอลลาร์สหรัฐสำหรับอินพุต และ 1.20 ดอลลาร์สหรัฐสำหรับเอาต์พุตต่อหนึ่งล้านโทเค็น Kimi K2.5 จาก Moonshot AI ที่ทำ 76.8% บน SWE-bench Verified รันที่ 0.60 ดอลลาร์สหรัฐสำหรับอินพุต และ 2.50 ดอลลาร์สหรัฐสำหรับเอาต์พุต GLM-5.1 จาก Z.AI เอาชนะ Claude Opus 4.6 ในเกณฑ์การเขียนโค้ดในไตรมาส 2 ปี 2026 โมเดล frontier ของจีน 4 ตัวถูกส่งมาพร้อมกันในกรอบ 12 วันช่วงต้นเดือนพฤษภาคม โดยทั้งหมดมีต้นทุนต่อโทเค็นต่ำกว่า 1 ใน 3 ของ Opus 4.7 ค่าใช้จ่ายของ DeepSeek V4-Pro สำหรับอินพุตแบบแคชอยู่ที่ 0.003625 ดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น

การวางตำแหน่งในตลาดข้ามผู้ให้บริการ

ช่องว่างด้านราคาระหว่างโมเดล frontier ของจีนและอเมริกาในไตรมาส 2 ปี 2026 อยู่ที่ 15x ถึง 30x แล้วแต่การเทียบโมเดล เกณฑ์พื้นฐานนี้มีอยู่ก่อนส่วนลดจากแคช Anthropic ยังคงปรับอัตราค่าใช้บริการของ Claude Opus 4.7 ให้คงที่ แต่ส่งมาพร้อมตัวตอกใหม่ (tokenizer) ที่สามารถสร้างโทเค็นได้มากถึง 35% สำหรับข้อความอินพุตชุดเดียวกัน

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น