登录

大模型也有“8小时工作制”!智谱GLM-5.1发布:长程任务能力首次超越Opus 4.6


速读:4月10日, 智谱 正式发布并开源了新一代旗舰模型 GLM-5.1。 智谱GLM-5.1发布:长程任务能力首次超越Opus4.62026-04-1008:50·。
2026-04-10 08:5

4月10日, 智谱 正式发布并开源了新一代旗舰模型 GLM-5.1 。这款模型最显著的突破在于其长程任务(Long-Horizon Task)处理能力,成为了全球首个能实现“8小时连续工作”的开源模型。

image.png

核心突破:从“一问一答”到“自主办公”

智谱团队 指出,大模型的下一阶段标准不再是简单的榜单分数,而是“能独立工作多久”:

8小时级续航: GLM-5.1 能够在一次任务中独立、持续工作超过8小时。期间它可以自主规划、执行、定位瓶颈并自我进化,最终交付工程级成果。

代码能力登顶: 在衡量专业软件开发的 SWE-bench Pro 基准测试中, GLM-5.1 实现了国产模型对海外 顶尖 模型 Opus4.6 的 首次 超越。

实测性能惊人: 在针对海量数据检索系统的编程测试中, GLM-5.1 经过6000多次操作优化,最终运行速度达到了此前 最好 成绩的6倍。

image.png

行业风向:告别“价格战”,转向“性能溢价”

随着性能的跨越式提升, 智谱 的定价策略也发生了重大转向:

价格追平海外: 平台数据显示, GLM-5.1 再次提价10%。在编码场景下的定价已 首次 追平海外头部厂商 Anthropic 。

回归商业价值: 智谱 CEO 张鹏 表示,长期低价竞争不利于行业,调价是为了将 AI 价值拉回正常区间。目前智谱已实现全球范围内的价值变现,API 业务 ARR(年度经常性收入)同比提升达60倍。

市场趋势:底层算力与模型集体步入“涨价潮”

2026年开年以来,国内 AI 行业正经历从“低价换量”到“价值定价”的集体转型:

腾讯云: 宣布 AI 算力及容器服务等产品统一上调5%。

阿里云: AI 算力相关产品价格上调5%-34% 不等。

百度智能云: 相关 AI 算力服务上调5%-30%。

结语:AGI 的“时间线”

业内共识认为,衡量 AGI 的重要指标是任务完成的时间线。前沿模型独立完成任务的时间每7个月翻一倍。随着 GLM-5.1 开启“8小时工作模式”,大模型正从一个随问随答的聊天机器人,正式转变为一个能够深度参与复杂工程的“虚拟员工”。

主题:智谱|GLM-5.1|任务