2026-04-11 11:25:38

国产 AI 大模型 GLM-5.1 登顶开源榜首:支持 8 小时独立编程

摘要
4 月 10 日消息:3 月底,智谱正式推出「GLM-5.1」大模型;其编程能力评分达 45.3 分,号称仅比全球最强的「Opus 4.6」低 2.6 分...

4 月 10 日消息:3 月底,智谱正式推出「GLM-5.1」大模型;其编程能力评分达 45.3 分,号称仅比全球最强的「Opus 4.6」低 2.6 分。

前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。

除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能力,还在长程任务(Long-Horizon Task)上取得突破,实现了:

8小时从零构建Linux桌面

655次迭代打破向量数据库优化瓶颈

1000轮工具调用优化真实机器学习模型负载

值得一提的是,在METR榜单的同等评估标准下,GLM-5.1是唯一达到8小时级持续工作的开源模型,也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。

国产 AI 大模型 GLM-5.1 登顶开源榜首:支持 8 小时独立编程

此前智谱提到,GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。

在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1刷新全球最佳成绩,超过GPT-5.4、Claude Opus 4.6。SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug,是衡量模型能否胜任专业软件开发的最硬指标。

国产 AI 大模型 GLM-5.1 登顶开源榜首:支持 8 小时独立编程

声明:文章不代表币圈子观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
热门新闻
热门百科
回顶部