大模型也有“8小时工作制”！智谱GLM-5.1发布：长程任务能力首次超越Opus 4.6

速读：4月10日，智谱正式发布并开源了新一代旗舰模型 GLM-5.1。智谱GLM-5.1发布：长程任务能力首次超越Opus4.62026-04-1008:50·。

2026-04-10 08:5

4月10日，智谱正式发布并开源了新一代旗舰模型 GLM-5.1 。这款模型最显著的突破在于其长程任务（Long-Horizon Task）处理能力，成为了全球首个能实现“8小时连续工作”的开源模型。

核心突破:从“一问一答”到“自主办公”

智谱团队指出，大模型的下一阶段标准不再是简单的榜单分数，而是“能独立工作多久”:

8小时级续航: GLM-5.1 能够在一次任务中独立、持续工作超过8小时。期间它可以自主规划、执行、定位瓶颈并自我进化，最终交付工程级成果。

代码能力登顶: 在衡量专业软件开发的 SWE-bench Pro 基准测试中， GLM-5.1 实现了国产模型对海外顶尖模型 Opus4.6 的首次超越。

实测性能惊人: 在针对海量数据检索系统的编程测试中， GLM-5.1 经过6000多次操作优化，最终运行速度达到了此前最好成绩的6倍。

行业风向:告别“价格战”，转向“性能溢价”

随着性能的跨越式提升，智谱的定价策略也发生了重大转向:

价格追平海外: 平台数据显示， GLM-5.1 再次提价10%。在编码场景下的定价已首次追平海外头部厂商 Anthropic 。

回归商业价值: 智谱 CEO 张鹏表示，长期低价竞争不利于行业，调价是为了将 AI 价值拉回正常区间。目前智谱已实现全球范围内的价值变现，API 业务 ARR（年度经常性收入）同比提升达60倍。

市场趋势:底层算力与模型集体步入“涨价潮”

2026年开年以来，国内 AI 行业正经历从“低价换量”到“价值定价”的集体转型:

腾讯云: 宣布 AI 算力及容器服务等产品统一上调5%。

阿里云: AI 算力相关产品价格上调5%-34% 不等。

百度智能云: 相关 AI 算力服务上调5%-30%。

结语:AGI 的“时间线”

业内共识认为，衡量 AGI 的重要指标是任务完成的时间线。前沿模型独立完成任务的时间每7个月翻一倍。随着 GLM-5.1 开启“8小时工作模式”，大模型正从一个随问随答的聊天机器人，正式转变为一个能够深度参与复杂工程的“虚拟员工”。