| 小 | 中 | 大 |
2026-05-12 20:56 来源:证券日报网
本报讯 (记者梁傲男)5月12日,全球权威评测机构ArtificialAnalysis发布全新CodingAgent基准ArtificialAnalysisCodingAgentIndex,用于衡量Agentharnesses(智能体编排)与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Benchv2和SWE-Atlas-QnA主流基准上的表现。 其中,闭源模型Opus4.7(在CursorCLI中运行)全球第一,智谱GLM-5.1(在ClaudeCode运行)取得开源第一。
榜单截图 ArtificialAnalysis在官方推文中点明了这一新榜单的“含金量”。“当开发者使用AI编程时,他们不仅在选择模型,也在将其与特定的Agentharness搭配使用。只有对这一组合进行基准测试,才能真正理解并比较不同模型的真实性能。” 从评测结果来看,GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。 (编辑 李家琪)
|


