登录

对话火山引擎谭待:拿下短剧行业还不够,Seedance的目标是世界模型|界面新闻·科技


速读:公司预告了将于7月上线的视频生成模型Seedance 2.5,该模型支持生成30秒原生视频。 谭待在大会上表示,大模型能力必须跨越“生产力质变点”才能真正满足生产场景需求,ClaudeOpus4.6是首个跨越该节点的模型。 竞争这么激烈,火山引擎是靠什么护城河守住这个位置的? 对于行业普遍关注的Seedance供给问题,谭待还强调称,视频生成模型和Coding/Agent模型结构不同,主要基于Diffusion架构,它对底层芯片(特别是高带宽HBM)要求相对较低。 第二,它最近会推出面向生产力场景的专业任务模式,搭载的就是我们最新发布的豆包2.1Pro模型。
对话火山引擎谭待:拿下短剧行业还不够,Seedance的目标是世界模型

针对近期AI大模型上市公司市值不断突破新高的现象,谭待还回应了火山引擎未来是否有独立拆分上市的打算。“据我所知,目前没有上市计划。”

伍洋宇 · 来源:界面新闻

请提供具体的文章标题。 火山引擎FORCE大会(图源:界面新闻)

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

“三年前我们决定把MaaS作为最重要的业务去推时,业界很多人还觉得卖Token是个赔钱生意。”谈及如何建立市场护城河,火山引擎总裁谭待表示,战略预见性也是保持竞争力的一种关键因素。

IDC数据显示,在中国公有云MaaS服务市场,火山引擎以49.5%的市场份额位居第一。据火山引擎披露,截至今年6月,豆包大模型日均Token调用量已突破180万亿,过去一年增长超10倍。

正值新一轮旗舰模型发布节点,火山引擎试图通过复杂任务环境下更强的落地执行能力以及成本优势,进一步巩固在国内企业级AI应用市场的份额。

6月23日,火山引擎举办2026FORCE大会,发布了包括豆包2.1 Pro在内的多款视频、图像、音频模型。

谭待在大会上表示,大模型能力必须跨越“生产力质变点”才能真正满足生产场景需求,Claude Opus 4.6是首个跨越该节点的模型。作为此次发布的核心,豆包2.1 Pro在编程(Coding)、智能体(Agent)和视觉语言模型(VLM)三大维度进行了升级。

根据火山引擎公布的行业基准测试(如SWE-Pro、OSWorld等)成绩,该模型在代码及多模态能力上表现出与海外主流模型(如Claude Opus 4.6)相当或更优水平。

在应用演示环节,火山引擎展示了豆包2.1 Pro在芯片设计RTL测试中连续运行近18小时并跑通完整工程流程的案例,以验证其在长周期、复杂任务中的稳定性;在另一项演示中,该模型支持了500多个智能体同步协作,完成了3D虚拟城市的生成。

豆包2.1 Pro的输入定价为每百万Tokens 6元人民币,输出为30元,缓存命中价格仅为1.2元。火山引擎表示,其综合使用成本较Claude Opus 4.6低近80%。此外,面向高频场景的Turbo版本价格进一步减半。

目前,豆包2.1模型已在火山引擎开放API服务,并陆续接入豆包、TRAE、扣子等产品。

此外,公司预告了将于7月上线的视频生成模型Seedance 2.5,该模型支持生成30秒原生视频,并已开始在具身智能、工业制造和自动驾驶等实体产业中寻找落地场景。

Seedance系列模型的SOTA表现以及AI短剧的需求增长,正在成为两股彼此促进的力量,使得Seedance成为这片市场的生产力主导。但火山引擎似乎并不满足于此,谭待对界面新闻记者表示,团队仍然 希望Seedance能够深入到各行各业的生产环境中去。

“特别是面向高端生产力制造和世界模型的构建,这是我们最看重的事情。”谭待说。

对于行业普遍关注的Seedance供给问题,谭待还强调称, 视频生成模型和Coding/Agent模型结构不同,主要基于Diffusion架构,它对底层芯片(特别是高带宽HBM)要求相对较低。由此,团队在火山方舟的模型推理上做了大量优化,可以让Seedance把包括低端芯片在内的各种算力利用起来。

“所以它和Coding、Agent模型在算力上没有任何冲突,算力分配完全不是问题。”他说。

发布会后的媒体采访中,谭待还谈论了API价格趋势、Seedance视频模型如何从内容生成走向世界模型、卖Token到底是不是好生意、AI Coding的当前竞争格局,以及Agent大规模行业落地的下一阶段方向等等。

针对近期AI大模型上市公司市值不断突破新高的现象,谭待还回应了火山引擎未来是否有独立拆分上市的打算。“据我所知,目前没有上市计划。”谭待说。

火山引擎总裁谭待(图源:界面新闻)

以下为谭待采访实录,略作编辑:

媒体:最近国产大模型的API价格涨跌互现,从火山引擎自身的经营以及行业整体的成本趋势两个方面来看,应该怎么理解我们今天新模型的定价策略?

谭待: 首先,我们看模型的价格不能只看绝对价格,要结合它的价值来看。模型能做更多的事情,创造的价值就更大。结合价格与价值来看,目前不管是火山引擎还是业界其他主流模型,虽然单Token的标价(List Price)在上升,但是单Token创造的价值上升得更快。所以对于模型来说,其实性价比是在提升的。这也呼应了一点:现在的模型,无论是 Coding(代码生成)、Agent(智能体)还是视频生成,都已经真正跨过了“生产力质变点”,能够创造更多的实际价值。

媒体:像Seedance 2.0这样的视频模型为火山引擎带来的单日创收能力是非常强的,这种涨势在多大程度上能持续?另外,短剧这个行业基本上已经被Seedance拿下了,视频模型需求侧的盘子是否已经基本饱和了?

谭待: 这是一个特别好的问题,我想说三点:

第一,外面传的所有关于Seedance的收入数据都是错的,而且偏高。我也呼吁大家不要再传了,这给了我很大的压力,财务天天来问我是不是藏了收入(笑)。

第二,影视短剧其实只是Seedance落地的一个环节,从长期来看,它可能只是一个小场景。我们在很多行业里都已经看到Seedance的广泛使用。比如在制造业和零售业,大家用它来制作产品说明,而且是针对不同国家、不同语种、不同人群的视频,这能帮企业更好地与消费者建立沟通。我们还看到很多知识行业、教育行业用它把知识视频化;在高端制造领域,比如“具身智能”,很多企业在用Seedance做数据合成,打破真实世界获取数据的瓶颈;自动驾驶企业也用它来合成极端天气或边缘路况,让算法运行得更稳健。

第三,从这个角度来说,我们认为Seedance其实是构建“世界模型”的基础。视频生成这种方式能进行大规模的无监督训练,对数据的假设最少,是合成世界模型非常有效的方法。要构建好的视频模型,离不开强大的底层能力,本质上它依托于豆包模型的能力。我们今天发布的豆包 2.1 Pro在Coding和Agent能力上已经超过了Claude Opus 4.6,跨过了生产级的门槛。所以,面向千行百业的广泛应用,以及作为世界模型的基础,才是未来Seedance更大的想象空间所在。

媒体:我们了解到Seedance正在成为越来越多视频生产服务商和代理商非常重要的API采购来源。火山引擎怎么看待这个行业趋势?希望自己形成怎样的生态定位?另外从算力保障的角度,目前资源分配机制是怎么样的?

谭待: 我先回答算力的问题。视频生成模型(Seedance)和 Coding/Agent 模型的结构是不同的,视频模型主要基于Diffusion架构。它对底层芯片,特别是高带宽HBM的要求相对较低。我们在火山方舟的模型推理上做了大量优化,可以让Seedance非常容易地把各种算力(包括低端芯片)用起来。所以它和Coding、Agent模型在算力上没有任何冲突,算力分配完全不是问题。这也正是Seedance能够得到大规模广泛应用的重要原因——我们在模型结构和工程能力上做了极大的优化和创新。

至于行业生态,我们希望Seedance能够深入到各行各业的生产环境中去,特别是面向高端生产力制造和世界模型的构建,这是我们最看重的事情。

媒体:关于“世界模型”,目前流派很多。字节跳动在这个领域的路线是什么?训练数据主要依赖视频数据还是具身智能这类真实交互数据?

谭待: 我们内部也是多条路线并行在尝试。但目前看来,“视频生成”是合成世界模型非常有效的一条路径。因为它对既有数据的假设最少,可以直接利用海量视频进行无监督学习。现在很多具身智能公司也在用 Seedance 合成数据,反哺他们的模型训练,所以我们非常看好这条路,这也是 Seedance 未来更有价值的场景。

媒体:我们看到火山引擎在提及多模态生成时,还是会探讨“能生成”到“可商用”的边界。团队是怎么定义这个边界标准的?多模态模型进一步大规模商用目前还有什么卡点?

谭待: 我们今天提的“生产力质变点”这个概念非常重要。定义这个边界其实很简单:去看看每个行业现有的业务流程是什么样的,每个流程对模型能力的要求是什么。达到了这个要求,你才算过了边界。

数据是不会骗人的。在Seedance 2.0出来之前,很多人说视频生成是玩具,从数据上看确实如此——周末的调用量远大于工作日,说明大家都在休闲时玩。但Seedance出来之后,数据反转了,工作日的调用量远大于周末。这充分说明大家是在办公、生产、数据合成的环节里真正在使用它,这就是生产力的跨越。

媒体:帮我们领导问个问题,因为他们都是豆包的忠实用户,最近感觉豆包的质量好像有所下降,想问问是不是为了推出付费版在做准备?

谭待: 我自己每天都在深度使用豆包,并没有感觉到质量下降。另外澄清一下,豆包 App 其实不属于火山引擎的业务范畴,但我据我所知:第一,豆包 App 会持续保持免费,并高质量地服务广大用户,这个承诺一直不变;第二,它最近会推出面向生产力场景的专业任务模式,搭载的就是我们最新发布的豆包 2.1 Pro模型。火山引擎的 API 从第一天起就是收费的,所以不存在为了收费降质的情况。

媒体:火山引擎现在的优先级,是更看重基础模型能力的发展,还是更看重Harness(执行环境/工具链)的模式?

谭待: 两者都很重要。火山引擎的最终使命是帮企业和开发者解决实际业务问题。客户要的不仅仅是一个好模型或一个好 API,他们需要的是一整套 AI 和 Harness 如何在企业环境中落地。

这涉及到模型如何与企业内部系统打通,如何与企业数据结合,如何做好安全、Agent 身份鉴权以及满足合规监管要求。所以我们今天强调“AI 云原生架构”:从底层的模型,到中层的 MaaS(包含一定 Harness),再到上层的 Agent Kit(包含更多 Harness 工具),最后到顶层的各类 AI 工作台。我们提供了零代码的、低代码的和高代码的,目的就是满足企业不同角色的多元化需求。

优先级是交错前进的:模型没到质变点时,提升模型最重要;跨越质变点后,Harness 和落地就变得同样重要。

媒体:智谱在港股估值非常高,海外的 Anthropic(Claude)和谷歌在AI Coding领域也取得了重大突破。请问火山引擎在拉近与最先进模型的距离上有哪些布局?怎么看市场给的高期望?

谭待: 面向 Agent 是我们非常重视的事情。Coding只是模型能力的一种展现形式,但它极其重要,因为它代表了模型具备很强的泛化能力,能够自动调用工具甚至自己写出软件来弥补工具的缺失。

Claude Opus 4.6是全球第一个跨过“生产力质变点”的模型。今年我们也看到有更多的模型跨过了这个门槛。我们最新推出的豆包 2.1 Pro旗舰版本,同样跨越了生产力质变点。从各项评测数据来看,它稳定超过了 Claude Opus 4.6,在某些场景下甚至与更高的版本持平。这意味着它真正进入了可以流转复杂长程任务的生产环境。

媒体:有人认为大模型容易陷入“用户越活跃、推理成本越高”的毛利陷阱,也有友商说单纯卖 Token 不是健康的生意。您怎么看?判断 AI 产品是不是健 康生 意的主要指标是什么?

谭待: 我觉得卖Token是一个非常健康的生意,不知道谁说它不健康。

媒体:关于商业化和安全性:在打通 AI 技术商业化链条上,火山引擎做了哪些关键动作?另外,目前像人脸素材使用引发了版权争议,Seedance 2.0 对人脸做了限制验证,未来的版本在安全性上会有什么调整?

谭待: 安全一直是我们最重视的事情。大家看到我们在正式对外开放 API 之前,花了好几个月时间打磨整个Seedance的安全策略。这不仅包括针对商业端的IP版权保护,也包括用户侧的人脸验证等。

我们在商业预览版里采用的就是 Opt-in(自愿授权)的模式,通过电子合同授权分成,形成良性商业闭环。未来如果做 B 端的人脸分身,也会采用正规的授权核验机制(类似剪映里的分身功能)。

媒体:关于算力,您提到自研 DPU 的路线,火山引擎在自研 DPU 以及底层算力上的思考和下一步计划是什么?目前火山引擎底层中“国产算力”的占比大概是多少?

谭待: 火山引擎刚成立不久就推出了自研 DPU。在当前 AI 大规模计算中,如何更好地卸载网络、存储、虚拟化和计算的各种负载,提升整体效率,DPU 和交换机起着至关重要的作用,我们一直有深度的自研投入。火山引擎这几年在 AI 上给人的印象是领先的,这离不开我们在底层基础架构上的深耕。

关于国产算力,我们用得非常多。像火山方舟做了大量的算力适配优化,让 Seedance 等模型能够把各种国内外的算力都很好地利用起来。具体占比数字我有点记不清了,但份额是挺大的。

媒体:上半年友商在 AI Coding 上的声量很大,而火山引擎似乎在 Seedance 视频模型上声音更响。怎么看待这种竞争差异?下半年在 AI Coding 上有怎样的增长预期?

谭待: 其实我们一直极其重视 Coding。去年在这个场地上,丁坤就着重讲过 Coding,那时候很多友商还没开始发力。上半年大家觉得 Seedance 声音大,主要是因为它确实是当时全球的 SOTA(领先水平),引发了很高的关注。

但在内部,我们一直认为 Coding 是更核心、更重要的能力。下半年我们会在这方面做更多动作。目前我们已经和大量高端半导体公司、互联网企业、SaaS 公司深度合作,将豆包的代码模型和 Trae(我们的 AI IDE)深度应用在他们的研发流程里。

媒体:大家都觉得火山引擎做视频模型有一个优势,就是能联动内部的“红果短剧”。下半年 Seedance 要进入其他行业,商业化上有什么打法?

谭待: 我没觉得联动红果是我们的优势。红果的策略是完全独立的,Seedance 生成的视频经常还会被红果审核不通过(笑)。所以这不算优势。我们真正的优势就是“模型能力强”,要想进入更多行业,最核心的打法还是继续把模型做得更强。

媒体:不少大厂都在做包括 AI 芯片在内的全栈布局,您如何看待这种布局的迫切性?字节是否有补齐芯片这一环的计划?

谭待: 站在一家云厂商的角度来看,我觉得自己有没有做底层的自研芯片其实不是特别重要。因为客户买的是你的模型能力,是看你能不能帮他解决问题,而不是看你底层用的是谁的芯片。比如 Anthropic,他们也没有自己的芯片,但这不影响他们做出强大的模型。

媒体:上半年大家谈 Token 时开始谈及“Token的价值”指标,比如核心系统接入率、自动化效率等。火山引擎是怎么推动团队去提升 Token 价值的?

谭待: 能力越强的模型,产生的价值肯定越大。但要把价值真正落地到行业里,必须要深刻理解行业,并与客户深度共创。比如我们懂写代码,懂互联网应用,但我们不一定懂制药或者教育。

所以我们今年专门成立了 FDE(前置部署工程师)团队,深入到每个行业中,和标杆客户深度共创。这样我们能更了解 AI 能为该行业做什么,客户也能了解 AI 的潜力,从而交付出更完整的方案,让 Token 真正进入实际生产中创造价值。

媒体:FDE团队的规模、人员背景是什么样的?目前覆盖了哪些行业?

谭待: FDE不是销售,也不是售前,他们必须具备很强的技术落地能力,特别是 AI 代码的落地能力。其次,我们非常注重成员的多元化行业背景。比如做生物工程出身的人去对接生物医药行业,他们在做落地时具备不可替代的 Know-How。目前覆盖的行业比较多,像汽车、医疗、教育、金融、半导体等重点行业都有专门的团队跟进。

媒体:您今天提到了 Agent Kit 的升级,包括零代码、低代码和高代码的多个工具产品(如 Trae、ArkClaw、Coze 等)。你们是如何思考这种布局,以及如何覆盖不同群体的?

谭待: 企业组织里有不同角色的人,专业开发者、产品经理、以及 HR/财务等职能人员。他们对 AI 工作台的需求截然不同,有的需要零代码开箱即用,有的需要低代码拖拽,专业人员则需要高代码环境。

应用场景的负载也不一样,有的是纯代码开发,有的是处理 Office/PPT 等通用办公任务。目前很难有一个产品能包打天下,所以我们推出一套多元的工具箱矩阵,覆盖从零代码到高代码的不同维度。未来这套矩阵也许会演化收敛,我们随着 AI 的发展去逐步迭代。

媒体:关于视觉模型,你们更看好以像素为中心的视频生成路线,还是多种类型结合的路线?

谭待: 我们肯定是多种方向都会去尝试。目前像素生成的路线(Diffusion)跑得比较快、效果比较好,所以我们投入的精力多一点;但其他流派如 3D 生成,我们也在做(比如豆包的 3D 模型)。无论哪种路线,最终的核心都是要把“生成”和“理解”做更好的贯通。

媒体:能否分享一下火山引擎模型出海的发展思路?

谭待: 我们非常重视海外市场。当然,火山引擎主要深耕中国市场,在海外我们有另一个实体负责。

模型本身是天然面向全球的。如果能力足够好,自然会吸引全球客户。比如 Seedance,现在有近一半的使用量来自海外,很多大型跨国公司和创作者平台(如 Canva)都在使用。海外用户主要看重的就是模型能力和性价比。我们也在全球(如东南亚、中东、欧洲等地)建立了 MaaS 接入点,方便全球开发者更好地调用。

媒体:内部判断一个新场景是值得单独做一个 Agent 产品,还是仅仅作为一个现有 Agent 的技能(Skill)模块,有什么衡量指标吗?

谭待: 首先看商业前景。如果这个场景的市场目标连 10 亿规模都达不到,那就最好别把它做成一个独立的 Agent 产品,写成一个 Skill(技能)加进去就好了。随着模型能力变强,以前需要复杂 Agent 的任务,现在可能写个 Skill 或者配置一个动态工作流(Dynamic Workflow)就能解决。

媒体:结合当前产业需求,您认为当前中国大模型市场处于什么发展阶段?

谭待: 还处于非常早期的阶段。如果去年大概跑了 500 米,今年就跑了一公里多一点。但这“一公里”非常关键,因为它标志着模型能力跨越了“生产力质变点”。现在国产模型只要达到或超过这个标准,就意味着它们真的能在生产环节中被使用并创造商业价值了。

媒体:大会提到截止目前豆包大模型日均 Token 调用量达到 180 万亿。这其中内部业务和外部客户的占比结构是怎样的?算力账本是怎样的?

谭待: 这 180 万亿是所有豆包大模型(包含内部业务、外部调用以及豆包 App)的总和。从单纯的 Token 数量上看,豆包 App 占比较大;但是从经济价值或者每个 Token 产生的消耗来看,外部客户(ToB 场景)的占比更高。因为对外的调用基本都是在复杂的生产级别使用,单次处理所产生的价值更高。整体的算力账本我们内部没有单独去拉平评估过。

媒体:目前火山引擎在国内大模型市场的份额占到了 49.5%。竞争这么激烈,火山引擎是靠什么护城河守住这个位置的?

谭待: 核心就是两件事:

第一是模型能力,特别是能否率先跨越“生产级质变点”。

第二是如何把模型带进企业里去。这包括 FDE 模式的落地、对行业的深刻理解、生态伙伴的深度合作,以及我们团队自身对 AI 解决方案的专业度。

可能还有一点就是战略预见性。三年前我们决定把 MaaS 作为最重要的业务去推时,业界很多人还觉得卖 Token 是个赔钱生意。对未来的确信也是我们保持竞争力的关键。

媒体: 刚才提到数字员工有 Token 考核,那现实中的真人员工会不会也将 Token 使用量纳入考核?会有 Token 福利支持政策吗?

谭待: 在我们内部,员工可以自愿开启一个系统来统计自己每天的 Token 使用量,但这纯粹是为了个人观察和提效,绝不会作为 KPI 考核。我们在实践中发现,有时候盲目套用 AI 是没用的——如果一件事情的目标设定或者第一性原理本身就错了,你用再多 AI 也解决不了。所以用 AI 前,还是要先回归业务本质想清楚目标。

媒体:如何看待近期 AI 公司市值不断突破新高的现象?火山引擎未来是否有单独拆分上市的计划?

谭待: 据我所知,目前没有上市计划。

主题:火山引擎|模型|谭待|豆包2.1Pro|生产力