ข้อความ Gate News, 24 เมษายน — รายงานทางเทคนิคของ DeepSeek V4 เปิดเผยว่า V4-Flash และ V4-Pro ถูกพรีเทรนบนโทเค็น 32T และ 33T ตามลำดับ ซึ่งเพิ่มเป็นสองเท่าของประมาณ 15T โทเค็นที่ใช้สำหรับ V3 รายงานยอมรับว่าพบ “ความท้าทายด้านความไม่เสถียรอย่างมีนัยสำคัญ” ระหว่างการฝึก โดยการสูญเสียมีการพุ่งขึ้นซ้ำแล้วซ้ำเล่าเนื่องจากความผิดปกติในชั้น Mixture-of-Experts (MoE); กลไกการเราท์ติ้งเองยิ่งเพิ่มความรุนแรงของความผิดปกติเหล่านี้ และการย้อนกลับอย่างง่ายไม่สามารถแก้ไขปัญหาได้.
DeepSeek ใช้โซลูชัน 2 แบบซึ่งนำไปใช้งานในการฝึกจริงแล้ว ได้แก่ การเราท์ติ้งเชิงคาดการณ์ (Anticipatory Routing) ซึ่งแยกการคำนวณดัชนีการเราท์ติ้งออกจากการอัปเดตเครือข่ายแบ็กโบน และจะทริกเกอร์อัตโนมัติเฉพาะเมื่อพบการพุ่งขึ้นของค่า loss (เพิ่มภาระประมาณ 20%), และ การหนีบค่า SwiGLU (SwiGLU Clamping) ซึ่งระงับความผิดปกติโดยตรงด้วยการหนีบค่าการกระตุ้นให้อยู่ในช่วงค่าคงที่ รายงานระบุว่าแนวทางทั้งสองมีประสิทธิผล แต่ยอมรับว่า “ยังไม่เข้าใจหลักการพื้นฐานอย่างเพียงพอ”.
Susan Zhang นักวิจัยของ Google DeepMind ผู้เคยทำงานที่ Meta AI และ OpenAI ได้แสดงความคิดเห็นว่า ความไม่เสถียรที่เกิดจากการเพิ่มปริมาณข้อมูลการฝึกเป็นสองเท่า “อธิบายความล่าช้าได้” เธอเรียกโซลูชันทั้งสองว่า “แผ่นปะชั่วคราว” พร้อมยอมรับความโปร่งใสทางเทคนิคของ DeepSeek
btc.bar.articles
Freshworks ลดงาน 500 ตำแหน่งในการปรับโครงสร้างขับเคลื่อนด้วย AI
Freshworks บริษัทซอฟต์แวร์สำหรับธุรกิจตั้งอยู่ที่ซานมาเตอ เคลิฟอร์เนีย ประกาศเมื่อวันที่ 5 พฤษภาคมว่าจะลดพนักงานลง 11% หรือราว 500 ตำแหน่งทั่วโลก เนื่องจากมีการปรับโครงสร้างเพื่อรองรับการนำ AI และระบบอัตโนมัติมาใช้อย่างกว้างขวาง โดยเดนนิส วูดไซด์ ประธานเจ้าหน้าที่บริหารกล่าวว่า ปัจจุบัน AI เขียนงานให้บริษัทมากกว่าครึ่งแล้ว
CryptoFrontier19 นาที ที่แล้ว
OpenAI เปิดตัว GPT-5.5 Instant ให้ผู้ใช้ ChatGPT ทุกคนตั้งแต่วันนี้เป็นต้นไป
ตามประกาศของ OpenAI เมื่อวันที่ 6 พฤษภาคม ตอนนี้ GPT-5.5 Instant พร้อมให้ผู้ใช้ ChatGPT ทุกคนใช้งานแล้ว สำหรับผู้ใช้แบบชำระเงิน GPT-5.3 Instant จะยังคงเข้าถึงได้ผ่านการตั้งค่าโมเดลเป็นเวลาสามเดือนข้างหน้า ก่อนจะถูกยุติการให้บริการ ฟีเจอร์หน่วยความจำกำลังทยอยเปิดให้ผู้ใช้แผนผู้บริโภคของ ChatGPT ทั้งหมดใน th
GateNews26 นาที ที่แล้ว
Google ทดสอบ AI Agent 'Remy' สำหรับ Gemini ขณะที่ Rivals เปิดตัว OpenClaw
ตามรายงานของ Business Insider เมื่อวันที่ 6 พฤษภาคม Google กำลังทดสอบเอเจนต์ AI ตัวใหม่ชื่อ Remy สำหรับ Gemini เอเจนต์ดังกล่าว ซึ่งตอนนี้มีให้เฉพาะพนักงานที่อยู่ในแอป Gemini ภายในของ Google เท่านั้น สามารถดำเนินการแทนผู้ใช้ได้ทั้งในงาน การเรียน และงานประจำวัน พร้อมทั้งเชื่อมต่อกับผลิตภัณฑ์อื่นๆ ของ Google
GateNews27 นาที ที่แล้ว
Meta วางแผนเปิดตัวผู้ช่วย AI ที่ขับเคลื่อนด้วยโมเดล Muse Spark เพื่อแย่งชิงฐานผู้ใช้ 3 พันล้านรายจาก OpenClaw ในวันที่ 6 พฤษภาคม
ตามรายงานของ Financial Times เมื่อวันที่ 6 พฤษภาคม Meta กำลังพัฒนา AI ผู้ช่วยที่ปรับให้เหมาะกับแต่ละบุคคลอย่างสูง เพื่อแข่งขันกับ OpenClaw โดยขับเคลื่อนด้วยโมเดลใหม่ Muse Spark เครื่องมือนี้จะให้บริการแก่ผู้ใช้งานของบริษัทมากกว่า 3 พันล้านราย และขณะนี้อยู่ระหว่างการทดสอบภายใน ผู้ช่วยคนนี้มีเป้าหมายเพื่อให้ผู้ใช้สามารถสร้าง AI
GateNews27 นาที ที่แล้ว
Alphabet เข้าใกล้มูลค่าตลาดของ Nvidia ที่ 4.67 ล้านล้านดอลลาร์ เพิ่มขึ้น 24% ในปีนี้
ตามรายงานของ Reuters ณ วันที่ 6 พฤษภาคม Alphabet มีมูลค่าอยู่ที่ประมาณ 4.67 ล้านล้านดอลลาร์สหรัฐ ใกล้เคียงกับ Nvidia ที่ 4.79 ล้านล้านดอลลาร์สหรัฐ ขณะที่นักลงทุนให้การสนับสนุนกลยุทธ์ด้าน AI และการเติบโตของคลาวด์ที่รวดเร็วยิ่งขึ้น หุ้นของ Alphabet เพิ่มขึ้น 24% ตั้งแต่ต้นปี เทียบกับการขึ้น 7% ของ Nvidia รายได้ของ Google Cloud พุ่งขึ้น 63% ใน
GateNews40 นาที ที่แล้ว
Cloudflare: AI Agents สร้างทราฟฟิกที่ไม่ใช่มนุษย์ เพิ่มขึ้น x402 และ x402 เสนอทางออก
หัวหน้าฝ่ายกลยุทธ์ของ Cloudflare ระบุว่า ปัจจุบันปริมาณการใช้งานอินเทอร์เน็ตมากกว่าครึ่งเป็นการใช้งานโดยไม่ใช่มนุษย์ ซึ่งสะท้อนถึงการเปลี่ยนแปลงครั้งสำคัญในรูปแบบการใช้งานเว็บที่ได้รับแรงหนุนจากเอเจนต์ AI และระบบอัตโนมัติ โดยผู้บริหารยังชี้ว่า x402 Foundation กำลังพัฒนาโครงสร้างพื้นฐานเพื่อรับมือกับความท้าทาย
CryptoFrontier2 ชั่วโมง ที่แล้ว