Artificial Analysis 发布编码代理基准;智谱 GLM-5.1 在开源模型中排名第一

Artificial Analysis 今天发布了新的 Coding Agent Index,用于评估当 AI 模型与智能体框架结合时在关键基准测试中的表现,包括 SWE-Bench-Pro-Hard-AA、Terminal-Bench v2 和 SWE-Atlas-QnA。在此次评估中,智谱 GLM-5.1 在开源模型中排名第一,展现了在真实场景下的代码智能体案例中领先的性能。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论