登录

智谱发布GLM-5 V-Turbo多模态Coding基座模型,为龙虾安上眼睛


速读:智谱发布GLM-5V-Turbo多模态Coding基座模型,为龙虾安上眼睛2026年04月02日08:29IT之家IT之家4月2日消息,今日,智谱发布面向视觉编程打造的多模态Coding基座模型GLM-5V-Turbo。
2026年04月02日 08:29

IT之家 4 月 2 日消息,今日,智谱发布面向视觉编程打造的多模态 Coding 基座模型 GLM-5V-Turbo。其具备以下特点:原生多模态 Coding 基座,兼顾视觉与编程能力,并深度适配 ClaudeCode 与龙虾场景。

据介绍,GLM-5V-Turbo 从预训练阶段深度融合视觉与文本能力,让编程不再局限于纯文本输入。模型能 看懂设计稿、截图、网页界面 ,并据此生成完整可运行的代码,真正做到看得懂画面、写得出代码。

在多模态 Coding、Agentic 任务以及纯文本 Coding 维度的评测基准上,GLM-5V-Turbo 均以更小尺寸取得了领先表现。

GLM-5V-Turbo 在设计稿还原、视觉代码生成、多模态检索与问答、视觉探查等基准上 均取得领先表现 ;在衡量真实 GUI 环境操控能力的 AndroidWorld 、WebVoyager 等基准上同样表现突出。在纯文本 Coding 能力方面,GLM-5V-Turbo 在 CC-Bench-V2 的 Backend、Frontend 和 Repo Exploration 三项核心基准测试中均保持稳定表现,表明视觉能力引入后,纯文本编程与推理能力保持了同等水准。

在 AutoClaw 等龙虾 Agent 中接入 GLM-5V-Turbo 后, 龙虾具备了真正的视觉能力 ,能看懂屏幕上的信息。模型在衡量龙虾 Agent 任务执行质量的 PinchBench 、ClawEval 和 ZClawBench 上取得优异成绩,验证了其在复杂任务执行场景中的综合能力。

图像即代码

为龙虾安上眼睛

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?

微信封禁自家“兄弟”红包,打的什么牌?

华住,比携程还会捞金?

特斯拉确认 Robotaxi 特定情况下将由人工远程接管:系“最后手段”

Claude Code源码泄露7小时:8大新功能/26个隐藏指令/6级安全架构,全被扒光了

小米汽车距离完成年目标差多远?后续月均需交付5.2万辆

OPPO K15 Pro系列首发磁吸镜头模组:支持3D打印DIY

张雪身价上亿还在用两千多块钱坏手机:没给自己买过一个豪华的东西

TechWeb微晚报:苹果iOS 27 Siri大更新,OpenAI关停Sora真实原因曝光

深开鸿自研国产操作系统 KaihongOS桌面版(X86)更新发布 小龙虾上线

岚图汽车3月交付新车15019辆 岚图梦想家为销量支柱车型

对抗A社丧心病狂的封禁:Claude源码泄露后反封号工具来了

广汽丰田铂智7光电测试成绩出炉 综合续航达成率86%

主题:GLM-5V-Turbo|为龙虾安上眼睛|领先表现