Google Research เปิดตัว ReasoningBank: เอเจนต์ AI เรียนรู้กลยุทธ์การให้เหตุผลจากความสำเร็จและความล้มเหลว

ข่าว Gate News วันที่ 22 เมษายน — Google Research เปิดตัว ReasoningBank ซึ่งเป็นกรอบงานหน่วยความจำของเอเจนต์ที่ช่วยให้เอเจนต์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่สามารถเรียนรู้อย่างต่อเนื่องหลังการใช้งานจริง กรอบงานจะสกัดกลยุทธ์การให้เหตุผลทั่วไปจากทั้งประสบการณ์ที่ทำสำเร็จและที่ทำไม่สำเร็จ โดยเก็บไว้ในแหล่งหน่วยความจำเพื่อใช้ค้นคืนและดำเนินการในงานในอนาคตที่คล้ายกัน กระดาษที่เกี่ยวข้องถูกเผยแพร่ที่ ICLR และโค้ดถูกเปิดซอร์สบน GitHub.

ReasoningBank พัฒนาต่อยอดจากแนวทางที่มีอยู่ 2 แบบ ได้แก่ Synapse ซึ่งบันทึกเส้นทางการกระทำแบบครบถ้วนแต่มีความสามารถในการถ่ายโอนจำกัดเนื่องจากความละเอียดที่ละเอียดเกินไป และ Agent Workflow Memory ซึ่งเรียนรู้จากกรณีที่ทำสำเร็จเท่านั้น ReasoningBank ทำการเปลี่ยนแปลงสำคัญ 2 ประการ: การเก็บ “รูปแบบการให้เหตุผล” แทนที่จะเป็น “ลำดับการกระทำ” โดยหน่วยความจำแต่ละรายการมีฟิลด์เชิงโครงสร้างสำหรับชื่อ คำอธิบาย และเนื้อหา; และการนำเส้นทางที่ล้มเหลวมาใช้ในการเรียนรู้ กรอบงานใช้โมเดลเพื่อประเมินเส้นทางการปฏิบัติอย่างละเอียดด้วยตัวเอง แปลงประสบการณ์ความล้มเหลวให้กลายเป็นกฎเพื่อหลีกเลี่ยงกับดัก ตัวอย่างเช่น กฎ “คลิกปุ่ม Load More เมื่อเห็น” จะพัฒนาไปเป็น “ตรวจสอบตัวระบุหน้าปัจจุบันก่อน หลีกเลี่ยงลูปการเลื่อนอย่างไม่สิ้นสุด แล้วค่อยคลิก load more”

บทความยังนำเสนอ Memory-aware Test-time Scaling (MaTTS) ซึ่งจัดสรรกำลังประมวลผลเพิ่มเติมระหว่างการอนุมานเพื่อสำรวจเส้นทางหลายแบบ และจัดเก็บข้อค้นพบไว้ในแหล่งหน่วยความจำ การขยายแบบขนานรันเส้นทางที่แตกต่างกันหลายชุดสำหรับงานเดียวกัน โดยปรับปรุงกลยุทธ์ที่ทนทานยิ่งขึ้นผ่านการเปรียบเทียบด้วยตนเอง ส่วนการขยายแบบต่อเนื่องจะปรับปรุงเส้นทางเดียวแบบวนซ้ำ โดยเก็บเหตุผลระดับกลางไว้ในหน่วยความจำ.

ในงานท่องเว็บของ WebArena และงานโค้ดดิ้ง SWE-Bench-Verified โดยใช้ Gemini 2.5 Flash เป็นเอเจนต์แบบ ReAct ReasoningBank ทำอัตราความสำเร็จได้สูงขึ้น 8.3% บน WebArena และสูงขึ้น 4.6% บน SWE-Bench-Verified เมื่อเทียบกับฐานที่ไม่มีหน่วยความจำ ลดจำนวนขั้นเฉลี่ยต่อภารกิจลงประมาณ 3 เมื่อเพิ่ม MaTTS ด้วยการขยายแบบขนาน (k=5) ยิ่งทำให้อัตราความสำเร็จบน WebArena ดีขึ้นอีก 3 จุดเปอร์เซ็นต์ และลดขั้นเพิ่มเติมได้อีก 0.4.

news.article.disclaimer

btc.bar.articles

CZ เผยว่า YZi Labs จัดสรร 70% ให้กับบล็อกเชน และ 20% ให้กับ AI ที่ Consensus Miami 2026

ตามรายงานของ ChainCatcher ที่งาน Consensus Miami 2026 จ้าวฉางเผิง (CZ) ระบุว่า YZi Labs จัดสรรเงินทุน 70% ให้กับบล็อกเชน 20% ให้กับ AI และ 10% ให้กับเทคโนโลยีชีวภาพ CZ กล่าวเพิ่มเติมว่า BNB ควรถูกวางให้เป็นสกุลเงินพื้นเมืองสำหรับเอเจนต์ AI และบล็อกเชนทั้งหมดต้องมีความพร้อมด้าน AI เพื่อรองรับ

GateNews36 นาที ที่แล้ว

Zypher Network ผสานรวม AIDEN เพื่อยกระดับการเข้าถึงความรู้ด้านบล็อกเชน

ตามประกาศอย่างเป็นทางการของ IQ AI เมื่อวันที่ 6 พฤษภาคม Zypher Network ได้บูรณาการ AIDEN ซึ่งเป็นเอเจนต์ปัญญาประดิษฐ์ที่พัฒนาโดย IQ AI เพื่อยกระดับการเข้าถึงความรู้ด้านบล็อกเชน และเสริมความสามารถในการตรวจสอบได้ภายในระบบนิเวศที่ขับเคลื่อนด้วย AI ความร่วมมือนี้ยังนำมาซึ่งหน้าวิกิที่เฉพาะสำหรับ…

GateNews38 นาที ที่แล้ว

Virtuals Protocol เปิดตัว OpenGradient Titan Airdrop แจกจ่าย 500K OPG วันนี้

ตามประกาศอย่างเป็นทางการของ Virtuals Protocol ตอนนี้การแจก Airdrop OpenGradient Titan ได้เริ่มการใช้งานแล้วตั้งแต่วันที่ 7 พฤษภาคม ผู้ใช้ที่มีสิทธิ์สามารถรับโทเค็น OPG ได้โดยตรงจากบัญชี Virtuals ของตน โดยวันนี้มีการแจกจ่ายโทเค็น OPG ทั้งหมด 500,000 โทเค็น เพื่อเป็นรางวัลให้แก่ผู้มีส่วนร่วมกับ Virtuals

GateNews4 ชั่วโมง ที่แล้ว

NVIDIA เปิดตัว Nemotron 3 Nano Omni แบบโอเพนซอร์สหลายรูปแบบ

NVIDIA เปิดเผย Nemotron 3 Nano Omni ซึ่งเป็นโมเดลมัลติโหมดแบบโอเพนซอร์ส โดยรวมการมองเห็น คำพูด และภาษาไว้ในโมเดลเดียว เพื่อทำหน้าที่เป็นชั้นการรับรู้ของ AI agent โดยแกนหลักคือ 30B-A3B MoE, context ขนาด 256K, อัตราการไหลงาน 9x รองรับอินพุตได้ทั้งข้อความ ภาพ เสียง และวิดีโอ เป็นต้น โดยผลลัพธ์เป็นข้อความ ร่วมกับ Nemotron 3 Super/Ultra เพื่อใช้งานในสถานการณ์ต่างๆ เช่น การควบคุมคอมพิวเตอร์อย่างอัจฉริยะ การเข้าใจเอกสาร และการเข้าใจภาพและเสียง พร้อมทั้งเผยแพร่น้ำหนักโมเดลและข้อมูลการฝึก เพื่อนำไปใช้งานได้ครอบคลุมทั้งบนเครื่องของผู้ใช้ NIM และแพลตฟอร์มของบุคคลที่สาม

ChainNewsAbmedia4 ชั่วโมง ที่แล้ว

NeoSoul และ AllScale ประกาศความร่วมมือเชิงกลยุทธ์ด้านเครดิตสำหรับเอเจนต์และการชำระบัญชีสเตเบิลคอยน์ในวันนี้

ตามรายงานของ ChainCatcher โครงการ NeoSoul ใน AI Agent Economy ประกาศความร่วมมือเชิงกลยุทธ์กับ AllScale ในวันนี้ (7 พฤษภาคม) เพื่อศึกษาแนวทางการสร้างเครดิตและกลไกการชำระด้วยเหรียญ stablecoin สำหรับการทำงานร่วมกันอย่างอิสระของเอเจนต์ ความร่วมมือครั้งนี้จะเน้นการทำให้กระบวนการชำระเงินระหว่าง Agents เป็นอัตโนมัติ—ซึ่ง

GateNews5 ชั่วโมง ที่แล้ว

FIS และ Anthropic พัฒนา AI Agents เพื่อการต่อต้านการฟอกเงิน โดยเตรียมทยอยเปิดตัวกับ BMO และ Amalgamated Bank ในช่วงครึ่งปีหลังของปี 2026

FIS และ Anthropic กำลังพัฒนาเอเจนต์ AI ที่ออกแบบมาเพื่อทำให้งานสืบสวนอาชญากรรมทางการเงินเป็นอัตโนมัติ โดยจะเริ่มจากการปฏิบัติการต่อต้านการฟอกเงิน เอเจนต์ AI ด้านอาชญากรรมทางการเงินจะดึงข้อมูลจากระบบธนาคาร ประเมินธุรกรรมเทียบกับรูปแบบที่รู้จัก และช่วยนักสืบในการตรวจทาน al

GateNews6 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น