登录

姚顺雨交作业腾讯迈出“混元重建第一步”


速读:4月23日,腾讯混元大模型迎来了组织架构调整后的首个重要里程碑,正式推出并开源了全新语言模型腾讯混元Hy3preview。 姚顺雨表示:“Hy3preview是混元大模型重建的第一步。
姚顺雨交作业 腾讯迈出“混元重建第一步” _ 东方财富网

姚顺雨交作业 腾讯迈出“混元重建第一步”

2026年04月24日 12:28

  4月23日,腾讯混元大模型迎来了组织架构调整后的首个重要里程碑,正式推出并开源了全新语言模型腾讯混元Hy3 preview。这是腾讯首席AI科学家姚顺雨加盟后,混元团队在重建预训练和强化学习基础设施后推出的首款模型,也被腾讯视为“混元重建的第一步”。

  这款总参数达295B的混合专家模型,在代码、智能体(Agent)等核心能力上实现了显著提升,并已在元宝、 腾讯云 等核心产品中上线。这一动作被业界解读为腾讯在AI赛道上按下的“加速键”,旨在通过技术架构的重塑与顶尖人才的引入,追赶在模型迭代与C端应用上表现激进的竞争对手。

   姚顺雨首秀答卷

  此次腾讯混元发布的Hy3 preview不是一次简单的版本迭代,而是腾讯混元大模型底层逻辑重构后的产物。

  据腾讯方面介绍,自2026年2月混元重建预训练和强化学习等基础设施以来,团队确立了模型追求实用性的三大原则:能力体系化(拒绝“偏科”,强调多能力深度协同)、评测真实性(跳出易被“刷榜”的公开榜单,侧重真实战斗力)以及性价比追求(深度协同架构设计以降低任务成本)。

  作为姚顺雨履新腾讯后的首款作品,Hy3 preview在参数规模上展现了腾讯的算力储备——总参数295B,激活参数21B,最大支持256K上下文长度。

  姚顺雨表示:“Hy3 preview是混元大模型重建的第一步。我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升Hy3正式版的实用性。”

  在性能表现上,Hy3 preview将代码与智能体作为提升最为显著的方向。得益于预训练及强化学习框架的重建,该模型在SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准测试中取得了具有竞争力的结果。此外,在清华数学博士资格考试(2026春)和全国中学生生物学联赛(CHSBO 2025)等高难度推理任务中,Hy3 preview也取得了优异成绩,展现了其在复杂逻辑推理上的泛化能力。

  目前,Hy3 preview已经在 腾讯云 、元宝、ima、CodeBuddy、WorkBuddy、QQ、腾讯文档等十余款产品中首发上线,微信公众号、和平精英等主线产品也在陆续接入中。

   竞争倒逼

  腾讯选择在2026年4月这个时间节点高调发布新模型,背后折射出的是其在AI赛道上日益紧迫的竞争压力。

  回顾2025年,尽管腾讯混元发布了超过30个新模型,并在3D生成、文生图等领域保持领先,但在大模型最核心的语言基座和C端应用上,腾讯并未完全达到市场预期。

  “腾讯在2025年年末按下AI战略‘加速键’,反映出其面临的竞争压力正在加大。”中经 传媒 智库专家、中国城市发展研究院投资部副主任袁帅对《中国经营报》记者分析指出,“AI已成为全球科技竞争的核心赛道,腾讯若不加速布局,很可能在未来的科技版图中被边缘化。”

  市场数据印证了这种焦虑。QuestMobile数据显示,在2025年三季度,腾讯元宝月活虽位居行业第三,但与月活破亿的字节跳动“豆包”相比,仍有量级上的差距。天使投资人、资深 人工智能 专家郭涛认为,元宝后续乏力的原因在于产品缺乏独特优势,且模型落地应用缺乏深度整合,未能形成有效的应用场景闭环。

  在此背景下,腾讯于2025年12月17日宣布重磅人事调整:曾任OpenAI科学家的姚顺雨出任“CEO/总裁办公室”首席AI科学家,并兼任AI Infra部和大语言模型部负责人。这一任命打破了腾讯过往“基建”与“算法”割裂的研发模式,转而效仿OpenAI的“研究-工程一体化”打法。

  “姚顺雨的加盟能给腾讯带来OpenAI级别的研发能力和认知。”顺福资本创始合伙人李明顺表示,“腾讯新架构将AI基础设施和大语言模型研发两条线都交由姚顺雨负责,意味着公司不再将两者割裂,而是用同一团队协同解决关键问题。”

   性价比之战

  在发布新模型的同时,腾讯也公布了具有攻击性的定价策略,试图通过“性价比”在B端市场抢占先机。

  在 腾讯云 大模型服务平台 TokenHub 上,Hy3 preview 的输入价格最低为 1.2元/百万tokens,输入命中缓存价格低至 0.4元/百万tokens,输出价格最低为 4元/百万tokens。同时,腾讯云还推出了个人版 Token Plan 套餐,最低定价28元/月。

  腾讯混元团队表示,通过深度协同模型架构和推理框架的设计,Hy3 preview 的整体推理效率提升了40%,大幅降低了任务成本。

  然而,腾讯要实现弯道超车,仍需跨过一些坎。

  根据QuestMobile数据显示,经过春节前后的红包大战,截至2026年3月,AI原生APP月活用户规模已达到4.4亿,其中,豆包、千问、DeepSeek位居前三位,月活用户规模分别为3.45亿、1.66亿和1.27亿。其中一季度豆包活跃用户增加1亿,而千问则是增加1.26亿,排名更是从2025年11月的TOP6提升至TOP2。而元宝在一季度的月活用户规模则为5735万,排在第四。

  可以看到,一季度腾讯AI在C 端的“超级入口”的愿景依然没有出现,Hy3 preview发布后,能否推动元宝产品力的大幅度提升,进而推动月活用户规模的大幅增长,是需要重点关注的问题。

  “正式上线之前,Hy3 preview在腾讯主要AI 业务进行了产品测试,获得明显正收益。”腾讯方面透露,在元宝端,混元与元宝进行了深度Co-Design。包括针对性地提升模型在意图理解精准度、文本创作质量、深度搜索等硬核指标上的表现,以及对文风、文笔、情商、内容组织和内容专业度上进行了精细化调优,希望给用户带来更智能且更具“活人感”的交互体验。

  另外,腾讯方面表示,Hy3 preview还在ima知识库问答、通用问答、公众号AI 分身、AI 客服、和平精英 AI NPC等场景评测中的表现都有显著提升。

  中国企业资本联盟副理事长柏文喜指出,腾讯拥有微信、QQ等庞大的社交生态和支付闭环,这是其最大的优势。但如何将基座模型的能力转化为开发者眼中的“技术信仰”,如何打破事业群(BG)之间的壁垒,统一接口标准,让Agent在微信生态中顺畅调用,是腾讯需要解决的难题。“腾讯需要一次像2012年公众号那样的底层协议级重构。”

  柏文喜还认为:“腾讯必须让开发者相信混元的新一代模型,在代码、数学、逻辑推理上至少持平GPT-4o,否则大家仍首选 DeepSeek或者Qwen做二次开发,那么腾讯就只能赚算力钱。如果2026年上半年腾讯能发布‘混元-Agent-1.0’并同步上线微信/QQ小程序级的Agent Store,就有机会借社交链快速分发、完成弯道超车。”

(文章来源:中国经营报)

主题:基金|新股|美股