天工AI发布SkyClaw-v 1.0：面向真实工作流的百万上下文Agent模型

速读：SkyClaw-v1.0支持百万token上下文，深度适配各类真实智能体工作场景，重点优化复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。强任务完成能力：在主流Agentbenchmark与Skywork内部Claw任务评测中，SkyClaw-v1.0展现出稳定的多步任务执行能力。 SkyClaw-v1.0的训练目标很明确：提升模型在Agentframework中完成真实任务的能力。团队进一步结合真实Claw任务数据和线上skill使用反馈，构建工具关系图谱，用来合成更接近真实工作流的复杂任务。 5月26日，昆仑万维旗下天工 AI 正式推出高性能 Agent 模型 SkyClaw-v1.0，并同步发布轻量化版本 SkyClaw-v1.0-lite。

2026年05月26日 19:36

　　5月26日，昆仑万维旗下天工 AI 正式推出高性能 Agent 模型 SkyClaw-v1.0，并同步发布轻量化版本 SkyClaw-v1.0-lite，兼具顶尖性能与极致性价比。

　　SkyClaw-v1.0 支持百万token上下文，深度适配各类真实智能体工作场景，重点优化复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。模型经过大规模 mid-train、高质量合成任务 SFT 与端到端强化学习优化，可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境中运行，同时适配Claude Code、Codex 等代码 Agent 框架，通用性与兼容性拉满。

　　Agent 模型和 Agent framework 的组合，正在改变模型的使用方式。过去，模型主要回答问题；现在，模型被放进一个能读取仓库、调用工具、编辑文件、运行测试、观察反馈的执行环境里，开始承担完整工作流。SkyClaw-v1.0 针对的正是这个阶段：让模型在长上下文和工具环境中持续推进任务，而不是只生成一段答案。

　　模型核心亮点

　　强任务完成能力：在主流 Agent benchmark 与 Skywork 内部 Claw 任务评测中，SkyClaw-v1.0 展现出稳定的多步任务执行能力。

　　全面超越主流开源模型：模型表现超过 Minimax 2.7、DeepSeek V4 Flash，以及 Qwen 3.6 35B A3B 和 27B 模型。

　　接近更大规模顶级模型：在 OpenClaw 相关任务上，SkyClaw-v1.0 表现接近 DeepSeek V4 Pro、Claude Opus 4.6、Qwen 3.6 Plus 等更大规模模型。

　　极具性价比：定价低于Minimax 2.7 与 Qwen 3.6 系列模型的一半，让高性能 Agent 能力具备规模化调用基础。

　　对于应用构建任务，我们建议将 SkyClaw-v1.0 运行在 Hermes、Claude Code 或 Codex 等 Agent 框架中，使其能够完成规划、文件编辑、测试执行与多轮迭代，而不是停留在代码片段生成。

　　核心训练思路：聚焦实景任务履约能力

　　SkyClaw-v1.0 的训练目标很明确：提升模型在 Agent framework 中完成真实任务的能力。训练重点放在三件事上：构建可交互的工具环境、筛选高质量任务轨迹，以及用强化学习提升多步执行稳定性。

　　智能体运行环境搭建Agent Environment

　　训练环境基于 OpenClaw-style agent frames 构建，覆盖文件读取、代码编辑、检索、测试、页面观察等高频 Agent 动作。模型在训练中不只是生成答案，而是需要选择工具、组合工具，并根据工具返回结果继续推进任务。

　　团队进一步结合真实 Claw 任务数据和线上 skill 使用反馈，构建工具关系图谱，用来合成更接近真实工作流的复杂任务。这样得到的数据不是孤立问答，而是包含目标拆解、工具调用、结果观察和迭代修正的完整执行链。

　　精细化合成训练数据Synthetic SFT Data

　　SkyClaw-v1.0 使用大量合成 Agent 轨迹进行 mid-train 与 SFT。

　　这一步主要解决 Agent 训练中的噪声问题。低质量轨迹会让模型学到无效工具调用、错误观察解释或偏离目标的中间步骤。SkyClaw-v1.0 通过轨迹质量过滤和数据配比实验，保留更稳定、更可复用的任务执行模式。

　　智能体强化学习迭代Agentic RL

　　强化学习阶段继续在自建 Claw 环境中进行。模型需要在可交互环境里执行任务、观察反馈、处理失败，并继续修正动作。优化目标从“回答是否好看”转向“任务是否完成、过程是否稳定”。

　　因此，SkyClaw-v1.0 在 OpenClaw、Hermes、Nanobot、Claude Code、Codex 等环境中使用时，优势更多体现在持续执行、错误恢复和多轮迭代，而不是单次回答的表面完整度。

　　多场景实战应用能力全面验证

　　在 Agent 框架中，SkyClaw-v1.0 可以完成规划、文件编辑、代码生成、测试运行、页面调试与多轮迭代，更适合交付完整应用、交互式游戏和研究型网页报告。这些示例均从自然语言提示开始，在 Hermes、Claude Code 和 Codex 等代理框架中完成。我们强烈建议在代理工作流中使用 SkyClaw-v1.0 作为模型，而不是作为独立的聊天模型使用。

　　a.全形态界面设计落地

　　SkyClaw-v1.0 可生成具备生产级布局、真实导航流程和完整交互状态的应用界面，覆盖多页面结构、列表筛选、详情页、表单、移动端适配等常见产品形态。

　　b.沉浸式可交互游戏开发

　　SkyClaw-v1.0 可生成可运行的交互式游戏与物理模拟，不只输出页面结构，还能处理动画循环、碰撞检测、游戏规则、状态管理和用户输入。

　　c.专业网页制作深度研究分析

　　SkyClaw-v1.0 也适合研究型网页和数据报告生成。模型可以围绕开放主题进行信息组织、数据整理、页面设计和可视化呈现，将自然语言需求转化为可交互的网页报告。

　　现已接入天工 Skywork，并开放免费试用

　　SkyClaw-v1.0模型已于2026年5月22日接入天工 Skywork。用户登陆https：//tiangong.cn，打开天工Skywork即可直接使用，无需额外配置 Agent 环境。

主题：模型|SkyClaw-v1.0