现场实录|汤道生对话姚顺雨:腾讯AI的下半场

在这场对话中,腾讯释放出的信号是:AI竞争已经从单纯的模型能力竞赛,进入模型、产品、真实场景、上下文和组织协同共同决定胜负的新阶段
整理| 吴俊宇
2026年,智能体成为AI产业应用的核心关键词。外界 长期关注腾讯这类大型科技公司在 模型、产品 和 组织 层面的进展。
6月5日,在腾讯AI产业应用大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生与腾讯AI首席科学家姚顺雨同台对话,系统阐释腾讯对“AI下半场”的 思考 。
姚顺雨出生于 1998年,本科毕业于清华大学姚班,后获普林斯顿大学计算机科学博士学位,曾在OpenAI从事语言智能体相关研究。2025年下半年加入腾讯后,他向腾讯总办汇报,并与团队在今年上半年推出Hy3 Preview(混元3预览版)模型。
姚顺雨认为, AI下半场最重要的问题,不再只是找到更好的方法,而是找到真正值得解决的问题。汤道生则强调, AI 时代做产品,那种开放式的服务形态会带来 大量新的挑战。
在这场对话中,腾讯释放出的信号是: AI竞争已经从单纯的模型能力竞赛,进入模型、产品、真实场景 、组织协同 共同决定胜负的新阶段。
以下为对话实录:
一、为什么加入腾讯? AI下半场最重要是什么?
姚顺雨 : 大家好。我平时都是在海淀区,很少来朝阳区,很高兴。
汤道生 : 今天我们两个对话,可能是一个比较新的形态,如果有什么出乎意料的,我想也是给大家一个惊喜。
顺雨,你加入腾讯前,我记得我当时问过你一些问题 ,为什么下半场会选择来腾讯?而且你认为 AI 下半场最重要的是什么?
姚顺雨 : 首先解释一下什么叫做下半场,我最近感觉这个词有点被滥用,这个概念是我去年 的 一个博客提出来的,什么意思?其实我觉得在去年之前 AI已经发展几十年,但是更加重要的是怎么去解决问题,去寻找好的方法,最近我觉得很明显就是说 , 方法论已经变得非常成熟, 但 寻找问题变得更加困难。
举个例子,比如说过去我们发明 AIphaGo (备注: 谷歌旗下 DeepMind 团队开发的 AI 围棋 ) 这样的方法 去下围棋 ,但是这个方法只适合用来下围棋或者下各种棋类。你会为了翻译做一个特别的模型,但是它只能做翻译,不能做其他事情。
但是有了预训练和后训练之后我们发现,我们像有一个万能锤子,它可以砸任何钉子,它是一个通用方法论,可以解决各种各样的问题,反而更困难的是怎么寻找好的问题去解决。
其实我觉得加入腾讯很重要一点,就是说这里有很多好问题 、 有很多产品 。 我觉得这一点在接下来变得越来越重要。
一方面 , 好的产品能够解决第一个问题 : 我们做预训练和后训练之后到底要把它应用在什么地方产生价值 。 第二个是环境是非常重要的,如果没有好的环境,那 Agent (智能体) 没有办法做各种各样的事情,比如说如果没有一个点外卖的 tool的话,就没有办法点外卖,很多事情做不到,我觉得最重要的是context( 可翻为上 下文 或 语境),无论是企业还是个人 。
就像我上一次在 AGI-Next (备注: 2026年1月 清华大学基础模型北京市重点实验室与智谱 AI联合发起的 AGI - Next前沿峰会上 ) 说的一样,我觉得越来越重要的事情是 context 。
因为模型越来越擅长把一个非常复杂的输入变成输出,很多时候你的竞争壁垒就在于你有没有最原始的输入,你知不知道这个人他到底在干什么,你知不知道这个企业各种各样的信息,这一点我觉得腾讯有非常强的优势。但其实我觉得这只是第二大的原因,最重要的原因是文化,我记得我第一次跟 你 聊天,包括和其他总办老板聊天的时候,我第一印象大家都非常诚实,哪里做的好哪里做的不好,非常直白不会掩盖,我觉得这种坦诚是我第一印象。
第二个就是说腾讯总体是一个基于 trust (信任) ,而不是基于 metric ( 监控 ) 去运转的公司,我觉得这一点对于做 AI是非常重要的,包括我觉得我们的文化有非常low e go( 低自我中心度 ) , 有 非常 solid的这一面,我觉得这些文化对于长期做一个AI的组织是非常重要的,包括我们对长期主义的坚持 。
所以 AI下半场最重要是什么?我个人觉得就是,我们应该在中国建立一个长期的基于AGI的组织,今天的AI主要有三部分:
首先是 foundation (基础) 的部分,我们怎么样把预训练和后训练最基础的东西做 得 非常 solid (备注:软件工程领域的一个词汇,形容 高内聚、低耦合、易于维护与扩展 ) 。
第二部分是产品,我们怎么样把这样的技术,真的为人和社会产生价值。
第三个是 frontier (前沿) ,我们怎么样探索新的研究范式,探索新的机会。
我觉得最重要的是我们构建一个非常均衡的三角形一样的组织。
我觉得对于做 foundation来说:
第一最重要的是有充足资源。
第二就是需要正确的做事的方式,这些和我刚才说的文化也是吻合的。对于产品来说,有好的产品的 sense,有这种做产品的 人 是至关重要的。
第三个,在中国我们今天所做的 前沿 探索不够多,所以我希望能把 frontier exploration (前沿探索) 的精神能更多 地 注入到我们组织中。
汤道生 : 你提到的聊的过程中感受到的真诚或者务实 的氛围 ,也是我经常跟客户交流得到的反馈,我觉得我们的做事方式,做产品的理念,其实也是比较实事求是的,毕竟 AI赛道是长跑 。
我觉得有时候认知也很重要,我们做的好的和不好的也得认,但关键是一个多维度的竞赛,我们看到现在模型有很多进步,我们做产品其实也是有越来越多的形态,不同的场景有不同的需求,我觉得未来还是非常可期的。
你 刚刚提到模型跟产品,产品可以说提供一个环境,里面要给模型提供 context上下文,我想问一个问题,我们平时开会提的有一个词比较多是Co - Design (协同设计) ,怎么把产品关模型能够比较紧密底结合起来 。
尤其今天有这么多丰富的产品,从我们合作非常紧密的像元宝这样的一个聊天机器人,包括 AI搜索,企业里面也有部署智能客服、智能营销,另外最近非常火的类龙虾像CodeBuddy、Workbuddy ( CodeBuddy、Workbuddy 都是腾讯旗下的 Agent产品) 这样的产品,其实对于模型依赖很深,你怎么思考 Co - Design这个方式?
姚顺雨 : 有三点 。
首先 , CoDesign的前提就是说模型本身要做的很solid,有很多foundational的work (工作) 要做好。首先我觉得预训练是一个相对就是产品 agnostic (不可知) 的事情,它做的非常 solid可以提供非常强的foundation,而且预训练它最大的特点就是它是一个可泛化学习过程,它的进步可以带给各种各样下游任务持续的价值提升。后训练我觉得最重要一点是要设立好正确的Ev al(评测和评估) ,中国大家有个不好的倾向是大家喜欢刷榜,但是我觉得 更重要的是 如何实事求是的基于产品,基于真正的应用,构造更加真实的 Ev al 。
第二 , 要意识到可能 “实用性”价值是大于刷榜价值,这一点我们做大量工作,跟各种各样产品进行了深度C o- Design,Co - Design很关键一点就是要产生相互信任,这一点我们做了大量工作,取得互信,怎么把产品数据用好,怎么把回流,怎么把Ev al 做好,有很多细节,我就不赘述。
第三点我想说, LLM (大语言模型) 时代和过去的 AI最本质的区别就是泛化性,在LLM之前比如说做翻译产品,只要把翻译数据做的特别好就行了。你做一个围棋的程序,你只需要把围棋的数据准备特别好就行。但是今天即使你想只做一个Coding Agent (代码智能体) ,你 会 发现其实需要的不仅是 Coding Agent的数据,你需要非常好的聊天能力,非常强的搜索能力,非常强的指令遵循能力,非常强的推理能力, 它 其实是非常复合的 data (数据) 的 taxonomy (分类学) ,我觉得需要对这个事情有一个 t aste(品位) 。
这个事情的推论就是说有很多产品的体系化地方,会有比较大的优势,比如说我们和元宝的 Co - Design使我们模型产生很强的聊天和搜索能力,这样的能力又可以被迁移到ima和Workbuddy其他的产品,所以这些产品能够提供不同的数据,但是这些数据之间又可以相互泛化,它形成一个像网络一样的体系,我觉得这一点的价值越来越重要。
汤道生 : 对,外部的榜也属于 E val 的一种,所以我们内部做 Eval 跟外部的这种榜有什么区别?
姚顺雨 : 首先 benchmark (基准测试) 还是有它的价值的,不是完全没有价值,只是说这些榜非常容易 overfitting(备注:过拟合, 指机器学习模型在训练集上表现极度完美,但在处理未见过的测试集或新数据时,预测准确率和表现却大幅下降的现象 ) 。基于真实世界的数据 会对模型的研发有 帮助 : 首先就是你能发现模型很多底线问题,实际上我们 先 发一个 Preview (预览版) 模型最主要的目的之一是希望能够获得真实世界反馈,能修复各种各样榜单中没有发现的问题,这个会 在 正式版上面有很大的改进。
第二点,你对真实的 Prompt distribution(提示词分布) 会 有一个更深的了解。我举个例子,比如说 benchmark上面的这些题目可能它都是非常精确的,有非常长的concrete d escription(具象描述),它可能一般来说是一个单纯的问题,但是我们知道在现实场景中可能大家问的问题都是比较模糊的,可能就一两句话,它会不停追问,这些 场景 可以启发我们怎么去更好做这样的训练。
第三点,我觉得甚至我们可以在这些产品上面获得一些灵感去推进现在还没有的榜单或者是没有领域的推进,比如说 我们 最近做了很多 Context learning (上下文学习) 的工作 ,包括 元宝 的反馈也 给我们 很大 的启发 和 帮助。所以我觉得产品和模型的互相成就是越来越重要的一个 AI的话题。
汤道生 : 我记得我们早期做元宝的时候还碰到多轮遵循的问题,好像在使用产品,大家这种迭代 Prompt (提示词) 的方式跟 benchmark还有差异,真正在产品里面大家使用所需要的能力确实好像跟benchmark还有蛮大的差异的。
二、腾讯 做产品第一性原理 ? AI应用和过去有何区别?
姚顺雨 : 你问我这么多问题,我也问你一个问题。
汤道生 : 欢迎。
姚顺雨 : 其实我记得我第一次跟您聊的时候,你跟我讲了很多你过去的经历,从 QQ空间、QQ秀的时代,一直到我小学时候最喜欢的产品。
到 QQ音乐,到云到现在的元宝,其实跟你聊天很有意思,因为你做过各种各样的产品, To C (面向消费者) 也有, To B (面向企业客户) 也有,远古时代的也有,最近 AI时代的产品也有。 我比较好奇,你觉得你做产品的第一性原理是什么,你觉得哪些经验和价值是不变的?哪些东西是变的?
汤道生 : 我觉得其实最终做产品还是本着用户到底有什么需求,我到底怎么去解决他的痛点,怎么去给用户或者客户创造价值。在不同的时代,甚至不同的行业,你做一个产品还是需要能够给用户带来价值,他才会买单,才会使用。所以我倒觉得从 PC 互联网时代我们做空间、移动的时代做各种各样的产品、内容的产品,到产业互联网做云,其实我们也要花好多的时间、精力去听客户的声音,尝试去帮助他们去解决他的问题。底层的逻辑其实没有这么大的变化。
但确实我觉得在 PC 互联网、移动互联网时代做产品跟今天在 AI 时代做产品还是有蛮多不一样的地方。 首先从范式的角度来看,在 AI 时代以前我们做产品很多时候想的是通过功能来满足用户的需求,你作为一个产品提供方、服务提供方,你想清楚我提供怎么样的一个能力,让用户可能通过某些菜单去选,好像是一些 “预制菜”,你只能在里面去点一样。
但在 AI 时代做产品,它的那种开放式的服务形态就会带来很不一样的要求跟挑战,用简单的交互方式可能是自然语言,可能是语音,其实作为产品方你也不知道用户会问什么。所以要充分利用模型能力去理解用户的需求,然后通过比如说今天大模型的这种逻辑推理,能去调用工具的能力,产品去给模型提供各种各样可以用的工具,来应对这种开放式的需求,这个是我觉得跟我们过去做产品很不一样的地方。
甚至也包括你刚刚提到的 E val ,以前我们做产品有很清晰 很具体的 产品的细节功能的描述,怎么去做设计、做研发、做测试,我觉得那个瀑布式的流程也比较清晰。
但是做 AI 产品,我发现最大的变化是我们整个流程可能都要重新设计,尤其今年大部分的代码都由 AI 生成,我们的工程师可能会花更多的时间去做设计,架构的设计,把写代码的工作都交给 AI 了,然后定期去指导一下、修正一下。
然后测试也要左移,更前置去想清楚针对我们各种案例 E val 、环境,我们对于开放式答案的要求,甚至 a lignment 怎么对齐,我们用户所需要的那种风格,我感觉今天时代做产品其实要求的能力更全面。
姚顺雨 : 更难了。
汤道生 : 更难了。我问你一下混元 3,大家都在说Hy3 preview (混元 3预览版) 是你腾讯的首秀,具体混元 3做什么改变,你能给大家介绍一下吗?
姚顺雨 : 其实我觉得没有什么秘密,今天做大模型从某种程度来说比较 Trivial (微不足道且琐碎) 的事情,我们应该把 Infrastructure ( AI基础设施) 做好,我们应该把数据做好,算法的部分反而是比较简单的。其实我觉得主要几个点吧。
第一,我们把 Infrastructure重建了,无论是预训练还是强化学习。第二是我们把数据和E val 做了很大的改变,如何去定义更真实的问题,如何丰富数据的 taxonomy ,如何去提高数据的质量,这是一个永无止境的追求。
第三,我觉得很重要的很多决策其实包括怎么去招人,怎么去设立模型的节奏,怎么去每天有很多的 Decision (决定) 要考虑很多 Trade off (权衡) ,我觉得可能没有一个很清晰的公式,我觉得是一个很 T aste driven(品味驱动)的事情。所以我其实挺好奇问你一个问题的,因为您刚刚跟我讨论Co-Design这个概念,我很好奇您对Co-Design这件事情是怎么想的,你觉得哪些事情是应该模型做的,哪些是产品应该做的?
汤道生 : 我觉得 Co-Design 在不同阶段,过去这两年其实是一直在变化的,我觉得这个变化某种程度来讲是随着模型能力的升级而变化,当然整个行业、市场、用户的需求他在变化的过程中也会带来我们两边模型跟产品需要更好去满足。
给我一个比较深的感受是怎么去对齐,因为在我们一起去做产品,去做对齐会的时候,我们有很多不同的决策,产品可能要针对某个方向去解决一些问题,模型到底怎么做去满足这个需求,但是你要回到模型需要数据,数据应该怎么标注,到什么颗粒度,到底什么是好的标注,什么是不好的标注,因为有一些地方要奖励,有一些地方要惩罚。
然后还有 E val ,还有评测,因为如果产品认为好的产品体验,评测是不认同的话,大家其实做出来的产品就会不一致了。所以 Co-Design给我的感觉更多是在项目组里面不同的角色参与到产品的设计,定了一些产品的目标方向,怎么让多个角色能够对于一些开放式问题有比较好的对齐 。
如果没有做到这样一个对齐的话,你会发现产品的行为会不可预测。甚至有时候会有一些随机性,因为模型训练的过程可能也被混淆了。
所以这是我这两年跟做产品跟模型团队做 Co-Design的一个比较深的感受。您觉得呢?
姚顺雨 : 其实我是觉得,就像我刚刚说的,首先最难的一点是要建立 Trust (信任) ,毕竟我觉得同理心很重要,因为说到底做模型的目标和做产品的目标有很多 align (对齐) 的部分,也有很多不 align的部分。就是模型人希望我能力越强越好,但是产品的人觉得 用 户需求越满足越好。所以天然有很多不 align的部分,我觉得很重要的一点是要有换位思考的能力。
其实就是你刚刚问我元宝我们是怎么一步一步 Co-Design的,其实一个很重要的细节是,我们当时是派了后训练最强的骨干力量,去帮助元宝把 后 训练做好。当时我们自己的预训练还没有准备好,但是我们知道维护 元宝 这样的产品以及它的 D A U (日活跃用户) 会对我们接下来做模型也非常非常重要,而且对于创新的合作非常重要。
所以当时其实很多算法同学不理解,我需要去很努力解释,但是现在看起来这些努力都是 Trade off,我觉得这样一个动作让产品意识到模型的同学是真的在为产品着想,我觉得这个其实对于我们之后的合作,包括Hy3 preview在元宝上成功上线起到了非常重要的作用。当然有很多技术的部分可以探讨,但是最难的部分反而是怎么样建立信任,怎么样换位思考。
汤道生 : 对,非常认同。我换一个话题,你是 ReAct架构 ( ReAct方法 , Reasoning+Acting是由姚顺雨在2020年提出的一种AI决策框架 ) 的提出者,博士研究也是围绕着语言智能体展开的,你几年前的一些观点到今天兑现了吗?比如有哪些?
姚顺雨 : 那天我挺感慨的,我重新读了自己的博士论文,感觉又回到一个很远古时代,我的博士论文的 标题 叫做 《 Language Agents: From Next-Token Prediction to Digital Automation 》( 《语言智能体:从下一词元预测到数字自动化》 ) ,是 2019年。
汤道生 : 7年前。
姚顺雨 : 那个时候 Literally (字面意思) 就是我们的 GPT - 2 (备注: 姚顺雨 当时在 OpenAI工作) ,那个时候它只能做 Next token prediction(下一个词预测 ) ,而且它产生一段话不太连续,或者有很多毛刺,所以当时人们很难想象到它有一天成为一个改变世界的力量 。
当时我觉得可能大家做的研究,稍微有想像力做一些研究 。 比如说 , 中国首都是,如果做 Next token prediction它会回答北京,somehow (一些时候) 它是一个有 Knowledge (知识) 的事情,能做到这一点大家当时非常开心,觉得这个技术很有意思。
当时我的想象力比较狂野,我觉得 GPT是一个非常优美的东西,吐下一个Token (词元) 是一个非常极简且非常通用的事情,我觉得它有一天潜力不仅仅是在于吐出下一个 Token,而在于把这个世界上所有的事情全部automate (自动化)。 我当时想的还不够大,我想的是 digital automation (数字化自动化) ,但是现在看起来也有可能是 digital and physical automation (数字和物理世界自动化) 。
我觉得其实我博士期间主要做两部分,第一部分就是如何建立一个 Agent方法论,如何把一个Next Token prediction的机器变成一个Agent,变成一个自动化的机器,最重要的工作可能是你说的react。
我记得 2022年7月份的时候某一天晚上,当我第一次把Pump two的API (应用接口)和 当时手写的一个 Wikipedia (维基百科) API连在一起,它第一次可以基于这个网页回答问题,并且多轮交互的时候,我当时感觉就像微弱电灯灯突然亮的感觉一样 。 我感觉据我所知,人类第一次把 LLM和互联网连在一起并且做多轮交互,我当时的感觉是,这个感觉可能在5年或者10年会改变这个事情,但是可能比我想象中还要更快。
我记得当时我们第一次提出 SWE-bench (备注: 目前全球软件工程领域最主流、最具挑战性的大型语言模型基准测试之一 ) 的时候,我觉得 OK,如果这个事情能做到,那很显然它会带来巨大价值,当时可能是几百亿、上千亿,但现在可能是数万亿,数是万亿,可能我想的还是太小了。
另一部分我做的工作就是怎么定义 Digital automation的任务,比如说WebShop (电商) 是第一个基于互联网的 Web Agent task (互联网智能体任务) ,包括 InterCode (备注: 一个用于评估大型语言模型在交互式编程任务中表现的标准评估 测试) 和 SWE-bench是最早的Coding Agent (代码智能体) 这样的任务。现在看起来 Agent技术最重要两个部分确实是外部Agent和Coding Agent。
那天我在群里跟大家聊天,我看我博士论文结尾,就是我在 2024年写我的future work (未来工作) ,第一个是 train models for Agent (为智能体训练模型) ,第二个是 shift and robust deployment,第三个是scientific discovery (偏移与鲁棒 部署 ) ,第四个是怎么样去 help human (帮助人类) ,我很感慨,我说我现在很幸运确实在做当时列的 future direction (未来的决定) 。
汤道生 : 太厉害了,都一一看到整个行业这些方向在推进。
姚顺雨 : 可能想的还是不够大,我觉得已经觉得自己想的够大了,但是可能还是不够大,我觉得。
汤道生 : 技术的发展往往超乎我们的预期。智能体今天大家都说需要消耗很多的 Token,Token的调用,这对于混元做下一代模型研发,你觉得什么是你的侧重,有哪些地方比较重要?
姚顺雨 : 毫无疑问今天 Agent或者Coding Agent有点像预训练一样,是不得不做的事情,是最基础能力。我个人觉得Coding Agent非常本质有很多原因。还有一个重要原因就是说它是一个优点像图灵完备的事情,当你有能力去控制自己的file system (文件系统) ,当你有一个 container (容器) 的时候,其实你是一个 complete (完成) 这样一个 system (系统) ,今天我觉得 Agent毫无疑问是每一家模型所发力的重点,我觉得我们做的方法可能会有几个区别:
第一,即使今天 Coding已经是最重要的事情,但是我们还是会强调体系的全面化,我始终认为要把Coding做好,其实需要远远不止C oding 的数据,也需要聊天、推理,各种各样不同的东西,因为大模型最重要的点是泛化性。
第二,很显然产品作用越来越重要,如何利用好线上回流,我觉得是一个每个模型厂商都在应对和思考的问题。这里刚刚积累很多 CoDesign 经验变得非常重要。
第三,我觉得还需要更多想像力,无论是技术演进,还是产品演进,甚至下一个范式演进,我们需要做探索性甚至不确定性的工作。
汤道生 : 从产品侧,因为大家越来越多有 Token焦虑的声音,Token成本爆发式增长,我也听到很多客户甚至用户身边的同事们也在紧盯着积分消耗或者Token消耗 。 怎么可以让我们的模型在解决某个问题,或者完成某个任务, Token效率高 ?
我之前做过一些任务可能是不同方向,有些方向也都知道肯定走不下去的,但可能模型还会试,试完之后走不下去再试下一个,里面有什么可以 optimize的地方让Token整体使用效率更高?
姚顺雨 : 我觉得在中国讨论性价比更多讨论模型架构,但其实它是很复杂的体系,我觉得最重要的是首先是你的 performance (性能)。
很多人跟我说,他最后发现用 O pus(Claude旗下的旗舰模型) 这样的模型比用更差的模型更省钱,因为更快的把这个事情做对了,也省得人的精力,最重要的事情是 performance,如果你的performance好,性价比是最关键的事情。
尤其我觉得今年可能很多简单任务的 robustness ( 稳健性、健壮性或鲁棒性 ) 会变得更加重要,一次把相对简单任务做对,这可能是性价比更关键的部分,不仅是模型架构。
第二部分就是成本它本身,性价比第一是性 能 ,如果性能不好性价比无从谈起。第二点是成本,中国是领先于世界的,就是我们做大量工作优化我们的成本,成本可能最重要的事情是怎么用一个更小的模型把更高的价值任务做好,在这基础上架构创新,包括长文管理,脚手架有很多需要做的事情。
如果我们做一个相对较小的模型,但是它比肩大模型性能,而且在大部分任务上做很强的 robustness,这可能在很多长程的上面提升一两个点的提升,可能在今天的中国更有价值。
我很好奇,您觉得 Agent,你是什么时候意识到它是一个什么新的产品的机会,以及你现在认知是什么,你觉得现在我们离一个好用的Agent bottlenck(智能体瓶颈)在哪里呢?
汤道生 : 我们做的 Agent ,针对不同场景有不同的产品形态,在 Agent 设计上面,很大程度是发挥好 模型 能力,当然模型在迭代它能力越强 Agent 需要做的工作越来越少 。
我看我们好几个产品在过去这段时间是随着模型能力加强 。 我们可以把产品,把 Agent 做的更简化,更多的给模型提供更多不同的工具,创造更多的 skills ,来让模型能够更高效的去完成任务,给模型提供更多的我们叫记忆,用户过去使用一些习惯 。
我们能提取出来的一些用户 preference 的信息作为上下文,在 Coding 环境有相关的 context 给到模型,在 Workbuddy 里边办公协作,做个 PPT ,可能大家关注的内容或者该给到模型的 context 也会不一样。
所以在我们做不同的 Agent ,我觉得更重要是了解场景下什么内容,什么信息,是重要的,比较 relevant 的,能够跟模型配合好,让模型有它需要的信息,同时也发挥它的能力。
姚顺雨 : 最近我们确实推出一些像 Workbuddy 口碑不错的产品,背后很多小团队在快速迭代产品,我其实挺好奇,相对于传统的产品研发,你觉得在新的 Agent 时代的研发和组织管理上,产品团队发生什么变化,你的思考是什么?
汤道生 : 我前阵子在帮 Workbuddy 做一个组织发文,我看了一下他们那个非常扁平化的组织,跟我们过去的其他产品组织架构有很大差异 。
更多小团队三个人五个人,可能围绕某一个领域来做攻坚,而且有很多试验在里面,还要支持 Infra (基础设施) 做实验,让不同的小分队可以去探索然后再验证 。
因为试验大部分拿不到正向反馈,我们也要包容团队去试错,这种通过大量试验去提炼出对于用户流程 。 这 对于我们想要的这个结果有正向帮助,这个是我觉得今天做 Agent ,做原生 AI 产品,这个组织形态要能够比较好去支撑。
另外,原来可能有很多工程师有很多时间花写代码,但是今天毫无疑问他们这些工作可以交给 AI了,所以我们会看到更多角色的融合,大家都是产品经理,都要去了解透彻用户需求,以及设计出我们想要的产品形态 。
每一个工程师更像一个有想法的 leader (领导者) ,驱动多个 Coding Agent,针对我们想要的产品需求去做研发、开发。同时要参与评测、测试,比较前置,也用好AI能力,把这些质量保证工作,对齐工作要做到前面来。
我也想再问一下一个可能大家比较多讨论的一个问题, 很多人 都会提到腾讯慢, 说 在 AI上面我们没有及时抓住一些机会,你觉得我们真的慢了吗?到底下半场是什么?你能再多说一下吗?
三、腾讯 做 AI真的慢了么?
姚顺雨 : 感觉应该是我问你的问题。
汤道生 : 哈哈。
姚顺雨 : 我觉得首先 AI其实今天有两个重要判断,第一个就是说我们认为AI是一个短期的游戏还是长期游戏?在硅谷大家蔓延很多情绪 。 哎呀, 一两 年后所有人都要失业, AI要取代所有人的工作,我们要赶快赚 两 年钱退休 。
但 很显然我们的判断 AI 是一个长期游戏,其实我觉得 AI刚开始,下半场才刚刚开始,我不认为ChatGPT和 Claude Code会是唯一的super App(超级应用) ,我觉得那是一个非常灰暗的世界,我觉得肯定会有源源不断新的机会诞生。
可能今天就像是 70年代PC (个人电脑) 刚刚产生的时候,我觉得还有很多很多事情需要做。
第二个判断,它会是个更线性还是多元游戏?因为确实过去几年大家能看到的是 Pre- training (预训练) 、 post training (后训练) ,然后 Agent,Coding Agent,似乎有一个非常清晰的主线,这个主线是所有人都在做一样的事情,都在copy (抄袭) ,这也是非常灰暗的事情。
但 到底未来变得更单一还是更多元?我个人看法会变得更多元,毫无疑问 Coding Agent 生产力会变得更加重要,我觉得它是刚刚开始的事情,这个世界还有 很多空间 没有被填满,多模态、具身智能,很多很多新的事情都在发生,或者刚刚发生,所以从这个角度来说,如果我们认为下半场刚刚开始,可能确实不是完了。
过去模型、产品做了很多探索,走很多弯路,我觉得这是正常的,你如果没有做过一个事情,第一次做肯定有曲折,但是我觉得可能更重要的事情是能不能诚实面对自己,能不能 Be Real,能不能够去看到feedback然后去改变,能不能够保持耐心,这个事情是下半场最重要的事情。
汤道生 : 大家对于腾讯经常喜欢挑某一个点来批评,当然我觉得我们也很欢迎大家给我们提更高的要求。
我们是一个非常多业态 的公司 , 有 很多产品 分布 在很多的赛道,同时也有很多的团队在推进不同的项目、事情。所以毫无疑问,在这样一个复杂的组织里面有一些地方可能我们做得快了,有的地方做得慢了,有一些地方可能会做失败,在探索。
所以我觉得这些提醒都非常好,我觉得确实有一些地方我们是可以做得更好,但是就像你说的,这是一个长跑,这是一个马拉松,腾讯还是有非常丰富的场景。
就你一开始提到选择腾讯,因为 AI需要Context,模型需要很多的这些上下文,其实腾讯在过去多年不同产品,在不同赛道的这些积累,其实都是可以针对每一个场景去为模型提供有用的信息,提供这些Context来发挥价值。
在这样一个长跑,我相信模型会不断迭代,用户的需求也在不断变化,也会有新的产品形态出现,我觉得我们比如说今年年初对 A gent 这一波热潮也反应比较快。同时也有像 WorkBuddy这样的智能体产品,其实也是几年前开始做的产品,沿着原来做Coding、CodeBuddy,慢慢看到非程序员也有很强的需求,我们也能比较快去应对,今天也听到很多客户对于我们的不同产品怎么去组合起来有非常高的期待。
所以我们正在长跑中,也请各位多给我们提醒,给我们建议,也多用我们的产品来给我们正向的反馈。
我看时间其实都超时了,我想我来首先感谢顺雨今天的分享,我们刚才其实围绕了做模型、做产品,谈到了 Co-Design,谈到了Agent的演进,也提到了组织变革,行业的一些机会,在过去一年其实我们看到非常多企业也有共同的困惑或者面临同样的挑战。产品如果用不好,企业不能持续去投入,或者ROI (投资回报率) 不够,这都会影响 AI在企业里面普及的进度。