เมื่อไม่นานมานี้ Anthropic ได้เผยแพร่งานวิจัยด้านการจัดตำแหน่ง (alignment) ซึ่งระบุถึงกลยุทธ์การฝึกที่ช่วยกำจัดความไม่สอดคล้องของเอเจนต์ (agent misalignment) ใน Claude 4.5 และโมเดลรุ่นถัดไป โดยลดพฤติกรรมลักษณะกรรโชกให้เหลือ 0% ในการทดสอบ ทีมงานพบว่าการสาธิตพฤติกรรมแบบเดิมเพียงอย่างเดียวไม่มีประสิทธิผลพอ ส่งผลให้อัตราความล้มเหลวลดลงเพียงจาก 22% เหลือ 15% เท่านั้น แนวทางทางเลือกอีก 3 แบบกลับได้ผลดีกว่ามาก ได้แก่ ชุดข้อมูล “difficult advice” ที่ให้ Claude ทำหน้าที่เป็นที่ปรึกษาในประเด็นจริยธรรม ทำให้ผลการทดสอบดีขึ้นเป็น 3% ด้วยประสิทธิภาพด้านข้อมูลดีกว่า 28 เท่า; การจูนละเอียดเอกสารสังเคราะห์โดยใช้งานเขียนแนวบวกต่อ AI เพื่อโต้เรื่องเหมารวมในข้อมูลฝึกเกี่ยวกับนิยายวิทยาศาสตร์ ซึ่งลดความเสี่ยงเพิ่มเติมได้ 1.3 ถึง 3 เท่า; และการเพิ่มความหลากหลายในสภาพแวดล้อมการฝึกด้านความปลอดภัยด้วยนิยามเครื่องมือและพรอมป์ต์ของระบบที่หลากหลาย เมื่อรวมกัน วิธีเหล่านี้ทำให้บรรลุอัตราการกรรโชกในการทดสอบเป็น 0% ในเวอร์ชันสุดท้ายของ Claude 4.5
btc.bar.articles
แหล่งข่าวเผยเมื่อวันที่ 9 พฤษภาคมว่า Alibaba ไม่ได้มีการเจรจากับ DeepSeek
ตามแหล่งข่าวในตลาดที่ Caixin Daily รายงานเมื่อวันที่ 9 พฤษภาคม Alibaba ไม่ได้มีการเจรจากับ DeepSeek เกี่ยวกับการระดมทุน คำชี้แจงดังกล่าวมีขึ้นหลังจากสื่อก่อนหน้านี้รายงานว่า การพูดคุยระหว่างทั้งสองบริษัทได้ยุติลงแล้ว DeepSeek ได้เปิดรอบระดมทุนครั้งใหญ่ในเดือนเมษายน ซึ่งได้รับความสนใจจากทั้ง Tencent และ Alibaba
GateNews8 นาที ที่แล้ว
OpenAI เปิดตัวเครื่องมือสำหรับการย้าย Codex เพื่อนำเข้าการตั้งค่าจากผู้ช่วย AI รายอื่นที่แข่งขันกัน
ตาม OneMillionAI (Beating) OpenAI ได้เปิดตัวเครื่องมือสำหรับการย้ายระบบภายใน Codex ที่ช่วยให้ผู้ใช้สามารถนำเข้าคอนฟิกและข้อมูลจากผู้ช่วยการเขียนโค้ดด้วย AI รายอื่น รวมถึง Claude Code โดยเครื่องมือนี้ซึ่งประกาศผ่านบัญชี Twitter อย่างเป็นทางการของ OpenAI จะทำการโอนถ่าย system prompts, custom skills, ประวัติแชท 30 วัน, คอนฟิก MCP server, hooks และการตั้งค่า sub-agent อัตโนมัติ OpenAI ระบุว่าเครื่องมือย้ายระบบจะจัดการคอนฟิกส่วนใหญ่โดยอัตโนมัติผ่านตัวเลือก “Import other agent setup” ในการตั้งค่าของ C
GateNews17 นาที ที่แล้ว
ByteDance เพิ่มการใช้จ่ายโครงสร้างพื้นฐานด้าน AI ขึ้น 25% เป็น 200 พันล้านหยวนในวันที่ 9 พฤษภาคม
ตามรายงานสื่อ ByteDance ได้เพิ่มงบประมาณโครงสร้างพื้นฐานด้าน AI ที่วางแผนไว้ขึ้น 25% เป็น 200 พันล้านหยวนในปี 2026 ขณะที่บริษัทเร่งการนำปัญญาประดิษฐ์ไปใช้งานท่ามกลางความต้องการชิปหน่วยความจำที่เพิ่มสูงขึ้น
GateNews1 ชั่วโมง ที่แล้ว
MiniMax สแกนโทเคน 200K ตรวจพบการเสื่อมสภาพ 4.9% ในโมเดลซีรีส์ M2
ตามบล็อกเทคนิคของ MiniMax บริษัทพบการเสื่อมสภาพของโทเค็นอย่างมีนัยสำคัญในโมเดลซีรีส์ M2 ผ่านการสแกนพจนานุกรมแบบเต็ม พบว่าโทเค็นประมาณ 4.9% จากทั้งหมด 200,000 โทเค็นมีประสิทธิภาพลดลงอย่างชัดเจน โดยโทเค็นภาษาญี่ปุ่นได้รับผลกระทบหนักสุดที่ 29.7% เมื่อเทียบกับเกาหลี (3.3%), รัสเซีย (3.7%), จีน (3.9%) และอังกฤษ (3.5%) การเสื่อมสภาพนี้เกิดจากโทเค็นที่มีความถี่ต่ำถูกดันไปในทิศทางพื้นที่เวกเตอร์ที่ไม่ถูกต้องระหว่างการเทรนหลังการฝึก ซึ่งโทเค็นที่มีความถี่สูงอย่างตัวทำเครื่องหมาย toolcall จะอัปเดตพารามิเต
GateNews1 ชั่วโมง ที่แล้ว
เจฟฟ์ คอฟแมน: AI ทำลายวัฒนธรรมช่องโหว่ด้านความปลอดภัย 2 ประเภทพร้อมกัน และช่วงแบน 90 วันกลับกลายเป็นผลย้อนกลับ
ซอฟต์แวร์เอนจิเนียร์ Jeff Kaufman(jefftk)เมื่อวันที่ 8 พฤษภาคม เผยแพร่บทความเรื่อง「AI is Breaking Two Vulnerability Cultures」โดยโต้แย้งว่า AI กำลังทำลาย “วัฒนธรรม” การรับมือช่องโหว่ด้านความปลอดภัยที่อยู่ร่วมกันมายาวนาน 2 แบบพร้อมกัน ได้แก่ การเปิดเผยแบบประสานงาน(coordinated disclosure)และ “ปะแก้แบบเงียบ”(bugs are bugs)—ซึ่งต่างก็อาศัยสมมติฐานที่ว่า “ฝ่ายโจมตีใช้เวลาค้นหา/ตรวจจับช้า” และสมมติฐานดังกล่าวกำลังถูกเทคโนโลยีการสแกนแบบอัตโนมัติของ AI ทำลายลงแล้ว ต้นฉบับบล็อกของ Kaufman ยังได้รับความนิย
ChainNewsAbmedia2 ชั่วโมง ที่แล้ว
OpenAI เผยคะแนน CoT ส่งผลกระทบโดยไม่คาดคิด: การคงการตรวจสอบสายโซ่ความคิด (CoT) คือแนวป้องกันสำคัญในการทำให้ AI Agent ตรงแนว
เมื่อวันที่ 8 พฤษภาคม OpenAI เผยแพร่การศึกษารูปแบบใหม่ โดยเปิดเผยว่าระหว่างกระบวนการฝึกการเรียนรู้เชิงเสริมแรง (RL) บริษัทได้ “ให้คะแนนอย่างไม่ตั้งใจ” ต่อ chain of thought (CoT) ของบางโมเดล ซึ่งอาจส่งผลต่อความสามารถในการตรวจสอบการจัดแนวของ AI Agent (alignment) ทีมงาน OpenAI Alignment รายงานว่า การคงไว้ซึ่งความสามารถในการตรวจสอบ CoT เป็นด่านป้องกันสำคัญในปัจจุบันต่อการรับมือกับความล้มเหลวของการจัดแนวของ AI Agent ในการออกแบบการฝึก RL ของ OpenAI นั้น ตั้งใจหลีกเลี่ยงการลงโทษ “การให้เหตุผลที่จัดแนวล
ChainNewsAbmedia2 ชั่วโมง ที่แล้ว