رسالة أخبار البوابة، 22 أبريل — أطلقت Google Research ReasoningBank، وهو إطار عمل لِـذاكرة الوكلاء يتيح لوكلاء مدفوعين بنماذج لغوية كبيرة التعلّم بشكل مستمر بعد النشر. يستخرج الإطار استراتيجيات استدلال عامة من تجارب المهام الناجحة والفاشلة على حد سواء، ويخزنها في “بنك ذاكرة” للاسترجاع والتنفيذ في مهام مستقبلية مماثلة. نُشرت الورقة البحثية ذات الصلة في ICLR، وتم فتح مصدر الكود على GitHub.
يُحسّن ReasoningBank نهجين قائمين: Synapse، الذي يسجل مسارات الإجراءات الكاملة لكنه يملك قابلية نقل محدودة بسبب الدقة الحبيبية، وAgent Workflow Memory، الذي يتعلم فقط من الحالات الناجحة. يُجري ReasoningBank تغيئين رئيسيين: تخزين “أنماط الاستدلال” بدلًا من “تسلسلات الإجراءات”، حيث تحتوي كل ذاكرة على حقول منظمة للعُنوان والوصف والمحتوى؛ وإدماج مسارات الفشل في التعلم. يستخدم الإطار نموذجًا لتقييم مسارات التنفيذ ذاتيًا، محوّلًا تجارب الفشل إلى قواعد لتجنّب الوقوع في المزالق. على سبيل المثال، تصبح القاعدة “انقر على زر تحميل المزيد عندما يتم رؤيته” “تحقق أولًا من مُعرّف الصفحة الحالية، وتجنب حلقات التمرير اللانهائي، ثم انقر على تحميل المزيد.”
تُقدّم الورقة أيضًا Memory-aware Test-time Scaling (MaTTS)، التي تخصص قدرة حسابية إضافية أثناء الاستدلال لاستكشاف عدة مسارات وتخزين النتائج في بنك الذاكرة. يقوم التوسّع الموازي بتشغيل عدة مسارات مميزة للاتّكال نفسه، مما يصقل استراتيجيات أكثر متانة عبر المقارنة الذاتية؛ بينما يقوم التوسّع التسلسلي بتحسين مسار واحد بشكل تكراري، مع تخزين التفكير الوسيط في الذاكرة.
في مهام متصفح WebArena ومهام الترميز SWE-Bench-Verified باستخدام Gemini 2.5 Flash كوكيل ReAct، حقق ReasoningBank معدل نجاح أعلى بنسبة 8.3% على WebArena وأعلى بنسبة 4.6% على SWE-Bench-Verified مقارنةً بخط أساس دون ذاكرة، مع تقليل متوسط الخطوات لكل مهمة بحوالي 3. وبإضافة MaTTS مع التوسّع الموازي (k=5)، تحسّن كذلك معدل نجاح WebArena بمقدار 3 نقاط مئوية إضافية وانخفض عدد الخطوات بمقدار 0.4 أخرى.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
Cloudflare: يمكن لـ x402 معالجة حركة الإنترنت غير البشرية
قال كبير مسؤولي الاستراتيجية في Cloudflare إن أكثر من نصف حركة الإنترنت أصبحت الآن غير بشرية، ما يبرز تحولاً في ديناميكيات الويب مدفوعاً بعوامل ذكاء اصطناعي (AI). ووفقاً للمدير التنفيذي، تعمل مؤسسة x402 على بناء بنية تحتية لدعم "العصر الذهبي للمحتوى" رغم هذه التحديات الاقتصادية
CryptoFrontierمنذ 48 د
شركات هندية للأمن السيبراني تستخدم الذكاء الاصطناعي لتقليص اختبار الثغرات إلى ساعات
تقوم شركات الأمن السيبراني الهندية، بما في ذلك Indusface وAstra Security، باعتماد وكلاء ذكاء اصطناعي مبنية على النماذج اللغوية الكبيرة لتسريع اختبار الثغرات الأمنية في البرمجيات من أيام أو أسابيع إلى ساعات، وفقاً لصحيفة The Economic Times. ويعكس هذا التحول تزايد سرعة المهاجمين وقدرة أدوات الذكاء الاصطناعي الناشئة على
CryptoFrontierمنذ 1 س
تلميح (Hive Intelligence) ارتفاع قياسي خلال 24 ساعة بنسبة 60.25%
جيت نيوز، 6 مايو، بحسب بيانات Gate للأسعار، عند وقت إعداد هذا التقرير، تتداول HINT (Hive Intelligence) عند 0.001695 دولار، وقد ارتفعت بنسبة 60.25% خلال 24 ساعة، وبلغت أعلى مستوى عند 0.0019 دولار، بينما تراجعت إلى 0.0010577 دولار كأدنى مستوى. وبلغ حجم التداول خلال 24 ساعة 10.01 ألف دولار. وتبلغ القيمة السوقية الحالية نحو 78.14 ألف دولار.
تُعد Hive Intelligence طبقة البنية التحتية لتطبيقات وكلاء الذكاء الاصطناعي، حيث توفر واجهة برمجة تطبيقات موحّدة لبيانات بلوكتشين الفورية. كما تلغي حالة تشرذم البيانات، ما يتيح لوكلاء الذكاء الاصطناعي إجراء الاستعلام والتفاعل على السلسلة دون عناء. وباعتبارها بنية تحتية مؤسسية لسوق التشفير، توفر Hive Intelligence عبر نقاط نهاية MCP وREST A
GateNewsمنذ 1 س
أطلقت Anthropic 10 وكلاء ذكاء اصطناعي ماليين، متكاملين مع Microsoft 365 لمعالجة الأعمال المالية بسهولة
طرحت شركة Anthropic 10 قوالب لوكلاء ذكاء اصطناعي متخصصين في التمويل، مع دمج شركاء في البيانات مثل Microsoft 365 وMoody’s وD&B، ويمكن استخدامها كإضافات أو بجدولة تلقائية. تُقسّم القوالب إلى نوعين: أبحاث/خدمة العملاء وأعمال مالية، وتشمل مجالات مثل الاستثمار والبحث، والنمذجة المالية، وKYC، كما تتضمن إدراج تصنيفات Moody’s. تتصدر Claude Opus 4.7 قائمة أفضل النماذج في معايير وكلاء التمويل، ما يشير إلى أن المواهب في القطاع المالي وأطر التنظيم ستتأثر.
ChainNewsAbmediaمنذ 1 س
توسّع شركة Nvidia والشركة ServiceNow شراكتهما وتقدّمان وكيل سطح المكتب للمشروع Arc
وفقاً لشركة Nvidia، وسّعت الشركات شراكتهما هذا الأسبوع لتقديم ServiceNow Project Arc، وهي وكيل سطح مكتب مستقل مؤمّن بواسطة Nvidia OpenShell وخاضع لإدارة ServiceNow AI Control Tower. وتهدف المنتجات إلى مساعدة المؤسسات على إدارة والتحقق من صحة وكلاء الذكاء الاصطناعي الذين تم نشرهم عبر d
GateNewsمنذ 1 س
أطلقت سولانا وGoogle Cloud خدمة Pay.sh، ويمكن لوكلاء الذكاء الاصطناعي إجراء مدفوعات بالعملات المستقرة بشكل ثابت
وبحسب تقرير Decrypt الصادر في 6 مايو، تتعاون مؤسسة Solana مع Google Cloud لإطلاق خدمة Pay.sh، التي تتيح لوكلاء الذكاء الاصطناعي الدفع عند الطلب مقابل رسوم الوصول إلى واجهات برمجة التطبيقات باستخدام العملات المستقرة على شبكة Solana، دون الحاجة إلى حسابات تقليدية أو اشتراكات؛ إذ لا يلزم أن يدفع الوكيل إلا بضعة أعشار من سنت أمريكي لكل مكالمة لواجهة برمجة التطبيقات، ولا توجد متطلبات بحد أدنى للإنفاق.
MarketWhisperمنذ 2 س