MiniMax випускає технічний звіт M2; Forge System досягає 40-кратного прискорення навчання

Згідно з Beating, MiniMax опублікувала свій технічний звіт M2 на arXiv, де детально описала флагманську MoE (mixture-of-experts) архітектуру та систему навчання агентів Forge. Компанія розкрила, як Forge оптимізує агентське підкріплювальне навчання з довгим контекстом за допомогою віконного FIFO-планування та технік злиття префіксного дерева, досягаючи до 40x прискорення навчання.

M2.7 продемонструвала можливості автономної самоеволюції агентів, завершивши понад 100 раундів циклів аналізу, ревізії коду та тестування. На бенчмарках продуктивності M2.7 досягла 56,22% на SWE-Pro і 52,7% на Multi-SWE-bench, а також 66,6% середньої частки винагород на MLE Bench, наближаючись до рівня продуктивності Gemini 3.1.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів