登录

天工AI发布SkyClaw-v 1.0:面向真实工作流的百万上下文Agent模型


速读:SkyClaw-v1.0支持百万token上下文,深度适配各类真实智能体工作场景,重点优化复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。 强任务完成能力:在主流Agentbenchmark与Skywork内部Claw任务评测中,SkyClaw-v1.0展现出稳定的多步任务执行能力。 SkyClaw-v1.0的训练目标很明确:提升模型在Agentframework中完成真实任务的能力。 团队进一步结合真实Claw任务数据和线上skill使用反馈,构建工具关系图谱,用来合成更接近真实工作流的复杂任务。 5月26日,昆仑万维旗下天工 AI 正式推出高性能 Agent 模型 SkyClaw-v1.0,并同步发布轻量化版本 SkyClaw-v1.0-lite。
2026年05月26日 19:36

  5月26日,昆仑万维旗下天工 AI 正式推出高性能 Agent 模型 SkyClaw-v1.0,并同步发布轻量化版本 SkyClaw-v1.0-lite,兼具顶尖性能与极致性价比。

  SkyClaw-v1.0 支持百万token上下文,深度适配各类真实智能体工作场景,重点优化复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。模型经过大规模 mid-train、高质量合成任务 SFT 与端到端强化学习优化,可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境中运行,同时适配Claude Code、Codex 等代码 Agent 框架,通用性与兼容性拉满。

  Agent 模型和 Agent framework 的组合,正在改变模型的使用方式。过去,模型主要回答问题;现在,模型被放进一个能读取仓库、调用工具、编辑文件、运行测试、观察反馈的执行环境里,开始承担完整工作流。SkyClaw-v1.0 针对的正是这个阶段:让模型在长上下文和工具环境中持续推进任务,而不是只生成一段答案。

  模型核心亮点

  强任务完成能力:在主流 Agent benchmark 与 Skywork 内部 Claw 任务评测中,SkyClaw-v1.0 展现出稳定的多步任务执行能力。

  全面超越主流开源模型:模型表现超过 Minimax 2.7、DeepSeek V4 Flash,以及 Qwen 3.6 35B A3B 和 27B 模型。

  接近更大规模顶级模型:在 OpenClaw 相关任务上,SkyClaw-v1.0 表现接近 DeepSeek V4 Pro、Claude Opus 4.6、Qwen 3.6 Plus 等更大规模模型。

  极具性价比:定价低于Minimax 2.7 与 Qwen 3.6 系列模型的一半,让高性能 Agent 能力具备规模化调用基础。

  对于应用构建任务,我们建议将 SkyClaw-v1.0 运行在 Hermes、Claude Code 或 Codex 等 Agent 框架中,使其能够完成规划、文件编辑、测试执行与多轮迭代,而不是停留在代码片段生成。

  核心训练思路:聚焦实景任务履约能力

  SkyClaw-v1.0 的训练目标很明确:提升模型在 Agent framework 中完成真实任务的能力。训练重点放在三件事上:构建可交互的工具环境、筛选高质量任务轨迹,以及用强化学习提升多步执行稳定性。

  智能体运行环境搭建Agent Environment

  训练环境基于 OpenClaw-style agent frames 构建,覆盖文件读取、代码编辑、检索、测试、页面观察等高频 Agent 动作。模型在训练中不只是生成答案,而是需要选择工具、组合工具,并根据工具返回结果继续推进任务。

  团队进一步结合真实 Claw 任务数据和线上 skill 使用反馈,构建工具关系图谱,用来合成更接近真实工作流的复杂任务。这样得到的数据不是孤立问答,而是包含目标拆解、工具调用、结果观察和迭代修正的完整执行链。

  精细化合成训练数据Synthetic SFT Data

  SkyClaw-v1.0 使用大量合成 Agent 轨迹进行 mid-train 与 SFT。

  这一步主要解决 Agent 训练中的噪声问题。低质量轨迹会让模型学到无效工具调用、错误观察解释或偏离目标的中间步骤。SkyClaw-v1.0 通过轨迹质量过滤和数据配比实验,保留更稳定、更可复用的任务执行模式。

  智能体强化学习迭代Agentic RL

  强化学习阶段继续在自建 Claw 环境中进行。模型需要在可交互环境里执行任务、观察反馈、处理失败,并继续修正动作。优化目标从“回答是否好看”转向“任务是否完成、过程是否稳定”。

  因此,SkyClaw-v1.0 在 OpenClaw、Hermes、Nanobot、Claude Code、Codex 等环境中使用时,优势更多体现在持续执行、错误恢复和多轮迭代,而不是单次回答的表面完整度。

  多场景实战应用 能力全面验证

  在 Agent 框架中,SkyClaw-v1.0 可以完成规划、文件编辑、代码生成、测试运行、页面调试与多轮迭代,更适合交付完整应用、交互式游戏和研究型网页报告。这些示例均从自然语言提示开始,在 Hermes、Claude Code 和 Codex 等代理框架中完成。我们强烈建议在代理工作流中使用 SkyClaw-v1.0 作为模型,而不是作为独立的聊天模型使用。

  a.全形态界面设计落地

  SkyClaw-v1.0 可生成具备生产级布局、真实导航流程和完整交互状态的应用界面,覆盖多页面结构、列表筛选、详情页、表单、移动端适配等常见产品形态。

  b.沉浸式可交互游戏开发

  SkyClaw-v1.0 可生成可运行的交互式游戏与物理模拟,不只输出页面结构,还能处理动画循环、碰撞检测、游戏规则、状态管理和用户输入。

  c.专业网页制作 深度研究分析

  SkyClaw-v1.0 也适合研究型网页和数据报告生成。模型可以围绕开放主题进行信息组织、数据整理、页面设计和可视化呈现,将自然语言需求转化为可交互的网页报告。

  现已接入天工 Skywork,并开放免费试用

  SkyClaw-v1.0模型已于2026年5月22日接入天工 Skywork。用户登陆https://tiangong.cn,打开天工Skywork即可直接使用,无需额外配置 Agent 环境。

主题:模型|SkyClaw-v1.0