ข่าว Gate News วันที่ 22 เมษายน — Google Research เปิดตัว ReasoningBank ซึ่งเป็นกรอบงานหน่วยความจำของเอเจนต์ที่ช่วยให้เอเจนต์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่สามารถเรียนรู้อย่างต่อเนื่องหลังการใช้งานจริง กรอบงานจะสกัดกลยุทธ์การให้เหตุผลทั่วไปจากทั้งประสบการณ์ที่ทำสำเร็จและที่ทำไม่สำเร็จ โดยเก็บไว้ในแหล่งหน่วยความจำเพื่อใช้ค้นคืนและดำเนินการในงานในอนาคตที่คล้ายกัน กระดาษที่เกี่ยวข้องถูกเผยแพร่ที่ ICLR และโค้ดถูกเปิดซอร์สบน GitHub.
ReasoningBank พัฒนาต่อยอดจากแนวทางที่มีอยู่ 2 แบบ ได้แก่ Synapse ซึ่งบันทึกเส้นทางการกระทำแบบครบถ้วนแต่มีความสามารถในการถ่ายโอนจำกัดเนื่องจากความละเอียดที่ละเอียดเกินไป และ Agent Workflow Memory ซึ่งเรียนรู้จากกรณีที่ทำสำเร็จเท่านั้น ReasoningBank ทำการเปลี่ยนแปลงสำคัญ 2 ประการ: การเก็บ “รูปแบบการให้เหตุผล” แทนที่จะเป็น “ลำดับการกระทำ” โดยหน่วยความจำแต่ละรายการมีฟิลด์เชิงโครงสร้างสำหรับชื่อ คำอธิบาย และเนื้อหา; และการนำเส้นทางที่ล้มเหลวมาใช้ในการเรียนรู้ กรอบงานใช้โมเดลเพื่อประเมินเส้นทางการปฏิบัติอย่างละเอียดด้วยตัวเอง แปลงประสบการณ์ความล้มเหลวให้กลายเป็นกฎเพื่อหลีกเลี่ยงกับดัก ตัวอย่างเช่น กฎ “คลิกปุ่ม Load More เมื่อเห็น” จะพัฒนาไปเป็น “ตรวจสอบตัวระบุหน้าปัจจุบันก่อน หลีกเลี่ยงลูปการเลื่อนอย่างไม่สิ้นสุด แล้วค่อยคลิก load more”
บทความยังนำเสนอ Memory-aware Test-time Scaling (MaTTS) ซึ่งจัดสรรกำลังประมวลผลเพิ่มเติมระหว่างการอนุมานเพื่อสำรวจเส้นทางหลายแบบ และจัดเก็บข้อค้นพบไว้ในแหล่งหน่วยความจำ การขยายแบบขนานรันเส้นทางที่แตกต่างกันหลายชุดสำหรับงานเดียวกัน โดยปรับปรุงกลยุทธ์ที่ทนทานยิ่งขึ้นผ่านการเปรียบเทียบด้วยตนเอง ส่วนการขยายแบบต่อเนื่องจะปรับปรุงเส้นทางเดียวแบบวนซ้ำ โดยเก็บเหตุผลระดับกลางไว้ในหน่วยความจำ.
ในงานท่องเว็บของ WebArena และงานโค้ดดิ้ง SWE-Bench-Verified โดยใช้ Gemini 2.5 Flash เป็นเอเจนต์แบบ ReAct ReasoningBank ทำอัตราความสำเร็จได้สูงขึ้น 8.3% บน WebArena และสูงขึ้น 4.6% บน SWE-Bench-Verified เมื่อเทียบกับฐานที่ไม่มีหน่วยความจำ ลดจำนวนขั้นเฉลี่ยต่อภารกิจลงประมาณ 3 เมื่อเพิ่ม MaTTS ด้วยการขยายแบบขนาน (k=5) ยิ่งทำให้อัตราความสำเร็จบน WebArena ดีขึ้นอีก 3 จุดเปอร์เซ็นต์ และลดขั้นเพิ่มเติมได้อีก 0.4.
btc.bar.articles
CZ เผยว่า YZi Labs จัดสรร 70% ให้กับบล็อกเชน และ 20% ให้กับ AI ที่ Consensus Miami 2026
Zypher Network ผสานรวม AIDEN เพื่อยกระดับการเข้าถึงความรู้ด้านบล็อกเชน
Virtuals Protocol เปิดตัว OpenGradient Titan Airdrop แจกจ่าย 500K OPG วันนี้
NVIDIA เปิดตัว Nemotron 3 Nano Omni แบบโอเพนซอร์สหลายรูปแบบ
NeoSoul และ AllScale ประกาศความร่วมมือเชิงกลยุทธ์ด้านเครดิตสำหรับเอเจนต์และการชำระบัญชีสเตเบิลคอยน์ในวันนี้
FIS และ Anthropic พัฒนา AI Agents เพื่อการต่อต้านการฟอกเงิน โดยเตรียมทยอยเปิดตัวกับ BMO และ Amalgamated Bank ในช่วงครึ่งปีหลังของปี 2026