Artificial Analysis публікує бенчмарк агента для кодування; Zhipu GLM-5.1 посідає перше місце серед моделей із відкритим кодом

Artificial Analysis сьогодні опублікувала новий Coding Agent Index, щоб оцінити, як AI-моделі працюють у поєднанні з агентськими фреймворками на ключових бенчмарках, зокрема SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 і SWE-Atlas-QnA. Zhipu GLM-5.1 посів перше місце серед моделей із відкритим кодом у цьому оцінюванні, продемонструвавши лідерську продуктивність у сценаріях реальних кодингових агентів.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів