Згідно з Beating, MiniMax опублікувала свій технічний звіт M2 на arXiv, де детально описала флагманську MoE (mixture-of-experts) архітектуру та систему навчання агентів Forge. Компанія розкрила, як Forge оптимізує агентське підкріплювальне навчання з довгим контекстом за допомогою віконного FIFO-планування та технік злиття префіксного дерева, досягаючи до 40x прискорення навчання.
M2.7 продемонструвала можливості автономної самоеволюції агентів, завершивши понад 100 раундів циклів аналізу, ревізії коду та тестування. На бенчмарках продуктивності M2.7 досягла 56,22% на SWE-Pro і 52,7% на Multi-SWE-bench, а також 66,6% середньої частки винагород на MLE Bench, наближаючись до рівня продуктивності Gemini 3.1.