影视行业130年没能滚起的雪球,现在有坡了
作者郑林《当造梦成本归零》之后的第二篇。上一篇讲成本,这一篇讲叙事本身。过去一百三十年,故事的验证先于角色的生长。这件事正在第一次反过来。
文 | 郑林
封面来源 | pexels
两个月前我发了一篇《当造梦成本归零》,把我对AI和影视未来1500天的判断全部摊开。
那篇文章传播得远超我预期。我收到过最多的一类反馈是:“你替我把不敢想的事想到底了。”我当时也以为自己想到底了。
两个月后我发现,没有。
那篇文章把成本曲线拆到了底,把产业链每个环节的传导路径画清楚了,把利润最终落在哪里算明白了。这些判断我今天仍然认为成立。但这两个月,密集地行业内交流,跟一批AI原生创作者反复碰撞,同时追踪了几条技术路径的最新进展。这些东西合在一起,指向了同一件事:
上一篇的问题不在判断上。在框架上。
那篇文章从头到尾在回答一个问题:当造梦成本归零,我们做电影和剧集的方式会怎么变?成本怎么降、产品怎么融合、利润被谁赚走。分析没有错。但它有一个没被检验过的前提: 终点还是“电影” 。更便宜的电影,更融合的电影,但还是电影。
电视不是播广播。互联网不是电子报纸。AI时代的影像内容,恐怕也不是“更便宜的电影”。
这篇文章想说的是另一层。过去一百三十年,故事的验证先于角色的生长,一个创作者心里的东西必须穿过几个亿、几百人、几十道关,才有可能到达观众。这件事正在第一次反过来。我管正在发生的这件事叫“叙事3.0”。
这篇文章试图回答几个问题:AI真正松动的到底是什么?过去一百三十年讲故事这件事被扭曲了什么?当角色不再被装进故事,而是故事从角色身上长出来,内容的形态会变成什么?围绕这种新形态,能长出什么样的公司?一个角色到底能不能真正地活?以及,当AI拿走了所有重活,创作者手里最后剩下的到底是什么?
写完之后我发现,这些问题最终指向的地方比我预想的远。它不只是一个行业的结构问题。它关于人和虚构之间的关系,被锁了一百三十年的那层关系,第一次被打开之后会发生什么。那个问题我没有答案。但假装它不存在,比回答不了它更危险。
全文约一万五千字,读完大约需要二十五分钟。如果你在做内容、在想AI会把创作这件事带向哪里、或者只是在想接下来自己该做什么,这篇文章可能值得你花一杯咖啡的时间。
上一篇,我试图给出判断。这一篇,我仍然在给判断,但我也在探索。有些问题我走到了能看见的地方,还没走到能回答的地方。
我写出来,是想听到你的回声。
第一问:一百三十年来,
我们到底在用什么方式造梦?
“几个亿、几百人、几年,装进一个U盘。为了端上那一盘醋,我们包了一百三十年的饺子。”
这张图,左边是我们做一部电影要动用的一切。几百个人,真实的场地、真实的光、真实的天气,发电车,化妆间,上亿的预算,三到五年的时间。右边是我们最终交付给观众的东西。一个数字文件。装进一个U盘,就能复制到全世界任何一块屏幕上。
几个亿,几百人,几年。最后得到一个拇指大的东西。
而且这个东西里装的不是真实发生过的事。是虚构的。
我们在真实世界里花真实的钱,去制造一个从来没有发生过的世界。
造汽车的在物理世界生产,交付物理世界的车。写软件的在数字世界生产,交付数字世界的产品。生产和交付在同一侧。我们反过来。生产完全在物理世界,交付的是一个数字文件。
一百年前这个文件装在几十公斤的胶片拷贝里。今天装进一个拇指大的U盘。容器越来越轻,但生产端的重量从来没变过。
我把这个结构性的错位叫做“U盘悖论”。
这个行业里每一个人的日常工作,拆到底都是同一件事:用物理世界的重量,去填满一个数字世界的容器。
这个悖论压了一百三十年。从卢米埃尔兄弟到今天的春节档,整个行业所有的钱、所有的人、所有的时间,本质上都在干同一件事:对抗物理世界的摩擦力,把创作者脑子里的虚构世界搬运到那个越来越小的容器里。
这一行有两句老话,一句叫“靠天吃饭”,一句叫“遗憾的艺术”。说的是同一件事。靠天吃饭,因为生产绑在物理世界上。遗憾的艺术,因为一个念头从创作者脑子里走到观众眼前,中间要穿过太多层。钱,时间,人,市场。每穿过一层,就损耗一次。
这是行业的处境。落到人身上,有一句话说得更准。
姜文导演说,就是为了这盘醋,包了这顿饺子。
电影里真正让观众离不开的那一下,那一口醋,是创作者心里的东西。但那口醋没办法直接端给观众。你得先包一整桌饺子。饺子不是不重要,饺子是呈现,是手艺,是让醋到达观众的唯一通道。过去一百年里最会包饺子的人已经把这门手艺做到了极致。但每一次,为了那一口醋,都必须先包一整桌。
那盘醋到底是什么?
不是我们常说的初心。是比初心更早一步的东西。一个画面,一句话,一种说不清楚的冲动。那一秒过后,他知道有一个人、一件事必须被说出来。不说出来自己过不去。
我把它叫做 “起心动念”。
过去一百三十年里, 起心动念是整条链条的起点,却是议价权最低的一环。 一个念头要活下来,必须先说服所有人。最重要的东西,最没有话语权。
起心动念就是那一盘醋。
过去要端上这一口,必须先包一整桌。这件事正在变。
第二问:叙事的顺序,
是从什么时候倒过来的?
“司马迁心里有一群人,让他们活过来。从念头到作品,中间没有一道关。1895年之后,这件事变了。我们在变了之后的结构里,待了一百三十年。”
讲故事,几千年来不是这个样子。
司马迁心里有一群人。项羽、刘邦、荆轲、陈胜、韩信。这些人在他脑子里活着,他知道他必须把这些人写下来。他就写了。十四年,一百三十篇,在竹简上一笔一笔刻。
中间没有任何一个人有权力决定他写什么、不写什么。他按常例本来不该把项羽放进本纪。项羽没当过皇帝。他放了。
从司马迁到每一个给孩子编睡前故事的妈妈,几千年来一直是这样。一个人心里有一群角色,他就让这些角色活过来。从念头到作品,中间没有一道关。
但1895年,这件事变了。
那一年卢米埃尔兄弟在巴黎放了几段几十秒的影片。后来的传说里,几十个观众尖叫着躲开银幕。这一刻被写进教科书,叫“电影诞生了”。电影确实诞生了。但那天还发生了另一件事,教科书没写。叙事第一次需要资本才能开始。
胶片要钱,洗印要钱,放映机要钱。这笔钱从一个人拿得出来,变成一个工业体系才拿得出来。从那一天开始,讲故事第一次需要别人先看懂,才能动手。
工业体系不能赌一个念头。资本需要确定性。于是顺序倒了过来。
司马迁的顺序是:心里有一群人,写出来。他自己的判断贯穿从头到尾。
1895年之后的顺序是:心里有一个念头,写成大纲,找投资人,说服投资人,写剧本,找演员,说服演员,再回去说服投资人,筹组团队,拍摄,后期,发行,观众看到。也许。每一步都可能让一个念头死掉。
能走完这条链条的念头,不一定是最动人的那些,往往是最能通关的那些。
过去一百三十年里,无数电影人在这条链条上倾尽才华,把能走完的那一部分做到了极致。链条很重,但扛着它的人,把重量变成了手艺。
但叙事本身,压弯了。
这一百三十年当然不是铁板一块。每一代技术都改变过这条链条的局部。
有声片出现,电影需要录音棚、混音师、声音设计,链条更贵了。一批默片大师在转型中被淘汰,但新一批大师在有声的土壤上长出来。观众听到了角色的声音,叙事的表达力大幅扩展。但一个念头要走完的那条路,没有变短。
电视出现,内容从影院走进客厅,触达几千万家庭。但一部剧从创意到播出仍然要穿过制片公司、电视台、广告商的层层审批。渠道变了,链条没有变短。
流媒体出现,终端从电视变成手机,用户从被动等待变成主动点播。Netflix改变了观众看内容的方式,但没有改变内容被做出来的方式。一部Netflix原创剧的开发周期和资本结构,跟十年前的传统电视剧没有本质区别。
每一次,工具变了,终端变了,渠道变了。但有一件事始终没有变: 一个念头要到达观众,仍然必须先通过所有人。
直到AI出现。它动的不是链条上的某个环节。它动的是链条本身的长度。当一个创作者心里的画面可以不经过物理世界直接变成影像,念头到观众之间那段属于工业的距离,第一次有可能被大幅压短。剩下的距离是他跟自己较劲。
叙事1.0是司马迁。心里有一群人,让他们活过来。从他往前几千年,往后到1895年,一直是这样。
叙事2.0是1895年之后的一百三十年。念头必须通关才能到达观众。
叙事3.0,正在开始。
第三问:
叙事3.0离我们还有多远?
“每一次我都在低估它。Sora刚出来那年我说2030年,今年2月我改成2028年。两个月后我已经不敢给数字了。”
3.0正在开始。但开始不等于到位。它离我们到底还有多远?
一个下午,我在纸上画了一张图。
一共三条线。一条大语言模型,一条图像模型,一条视频模型。
大语言模型那条线从2020年的GPT-3开始,五年后走到了程序员每天在用的助手。图像模型那条线从2021年的DALL-E开始,同样大约五年,走到了设计师每天在用的生产工具。视频模型那条线从2024年2月的Sora开始,到今年2月的Seedance2.0和可灵3.0。这条线才走了两年。
画完之后我看了很久。
三条线的节奏几乎一样。起步都是技术圈震动、圈外无感。中段都是跨过一道坎、接入亿级用户、触发上一代产业的应激反应。后段都是从一个惊艳的demo变成一个真正能用的工具。三个不同的技术方向,起点相隔几年,走的却是同一条路。
前两条从实验室demo到行业日常工具,都走了大约五年。第三条的方向一样,但路会更颠簸。视频模型的算力成本比前两条高一个量级,中段的震荡会更剧烈。但方向不会变。
三条曲线看起来各自独立,底层其实是交织的。文字模型的推理能力在喂养图像模型的空间理解,图像模型的进步又在为视频模型铺路。每一条曲线的加速,都在帮其他两条缩短路程。
这意味着视频曲线不是独自在走。它在被另外两条曲线推着走。第三条线会比前两条快。它脚下已经有了前两条线铺好的路。
上一篇文章发出去之后,短短两个月,这条曲线上密集地发生了一连串事情。而且跟前两条曲线不同的是,原本应该在中段散开来发生的事情,正在同时发生。
先是产业端的应激反应。 美国电影协会代表好莱坞主要电影公司联合向字节跳动发出停止函,指控Seedance2.0侵权。两位参议员联名致信要求关停。好莱坞对AI视频的恐惧,从暗流变成了明牌。
然后是先行者的退出。 OpenAI宣布关停Sora。用户数从峰值的一百万跌到不足五十万,算力账单每天超过一百万美元,上线半年累计收入仅两百余万美元。三个月前刚刚跟迪士尼签下的十亿美元合作协议,随之终止。Sora的app将在今天正式下线。
Sora关停不是这条路走不通。是OpenAI在算力分配上做了取舍,把资源让给了更赚钱的业务。它让出的市场空间,几乎被中国玩家同步接走。
接下来的事情更密集。 HappyHorse匿名登顶第三方视频生成盲测榜单,超越Seedance2.0,几天后被阿里认领。Seedance2.0通过第三方API向全球开发者开放。可灵发布原生4K。
与此同时,OpenAI在关停Sora后不久,发布了GPT-Image-2,在图像生成榜单上以碾压级的优势登顶。这两件事放在一起看,也许意味着它并没有放弃视频,而是在试一条不同的路:不是造一个独立的视频生成器,而是让视频能力从文字和图像的土壤里自己长出来。
前两条曲线从ChatGPT时刻走到日常工具,都用了大约两年半。第三条曲线走到ChatGPT时刻才两个月,两年半这个数字,要往下调。调多少,今天没人说得准。
前段时间我重读了库兹韦尔的《奇点临近》。这位老人二十年前提出过一个判断,叫加速回报定律。两句话:
“技术进步是指数的。人的直觉是线性的。”
二十年前的两句话,精确地描述了我们此刻正在经历的事。我们看到一件事的时候,本能会用上一年的速度去推下一年。在草原上判断一头狮子离你还有多远,线性思维是对的。但在一个底层成本以指数速度下降的世界里,线性思维每一次都会把节点推到比真实发生的那一天更晚的位置上。
这件事我自己也反复错过,每一次修正判断都是因为上一次又用了线性思维。
三条曲线给出的信号已经足够清晰。从一个创作者心里的念头到观众眼前的画面,中间属于工业的那段距离,正在以超出所有人预期的速度被压短。但3.0不只是一个技术问题。当这条路真的被压短之后,站在起点的那个人,应该往哪个方向走?
第四问:当影像唾手可得,
我们到底应该做什么?
“过去,故事是容器,角色装在里面。3.0反过来。角色是根,故事从她身上长出来。”
从创作者心里的画面到观众眼前的影像,中间属于工业的那段距离正在被大幅压短。
但压短之后怎么办?
最直觉的反应是:太好了,我可以用更低的成本拍一部电影了。
这个反应跟古登堡做的事一模一样。
1455年,德国美因茨,一个叫古登堡的人印出了欧洲第一批印刷书。印刷机是那个时代最革命性的发明,让一本书的制作成本降到了手抄本的几十分之一。古登堡却做了一件今天看起来很奇怪的事:他把这些印刷书做得跟手抄本一模一样。字体照着手写刻,版式照着手抄本排,连页边都空着,留给抄写员去加花纹。
手里有一个全新的技术,却用它去模仿旧手艺。让印刷机装作自己是一支笔。
这件事花了差不多一百年才变过来。到1550年前后,印刷书才慢慢长出了属于自己的样子:章节、目录、页码。这些东西在手抄本时代不存在。没有人在1455年预见到它们。
每一种新媒介刚出现的时候都是这样。它还不知道自己是什么,只好先穿着上一代的衣服。
我们此刻也站在同一个位置上。AI已经来了,但我们最想用它做的还是:九十分钟,线性叙事,一个团队做完交给观众看。更便宜的电影,更快的电影,但还是电影。
古登堡用了一百年。今天的技术每一两年翻一倍。一百年换算到今天,可能就是五年,甚至更短。3.0时代的内容会长成什么样,今天没有人完全知道。但有一件事已经逐渐清晰了。
这一行被压了一百三十年的一种可能性,第一次被释放出来。它叫:
“角色优先”。
过去,故事的验证先于角色的生长。一个能被资本听懂的故事先成立,角色被装进这个故事里。3.0之后,这个顺序第一次可以反过来。角色先于故事框架,故事从这个角色身上长出来。
有一个人已经用十五年证明了这件事。
2011年,一个网名叫木头的年轻人在网上传了一段五分钟的动画《罗小黑战记》。十五年后,这只黑色小猫两次走进院线,累计票房近9亿。他有了自己的世界、自己的朋友,一群从初中追到工作的观众。
做这件事的人一个人扛了两个行业的重量。漫画家做的事,他做了:把这只猫的灵魂一点一点养出来。电影工业做的事,他也做了:把一个角色从五分钟网络动画推到大银幕上。代价是十五年。
这件事过去稀缺,不是因为没有人有这个才华。是因为才华之外还需要一个人扛两个行业的重量,绝大多数有才华的人被重量压倒了。
一旦工具出现,它不会再是孤例。
这里有一个容易混淆的地方。角色优先不是IP复用。007拍了二十多部,每一部里都是他,但每一部都是一个独立的故事,他被装进去。换一个演员照样拍。那不是角色先于故事,那是同一个名字被放进了不同的故事里。角色优先讲的是他自己在往前长,下一个故事从他身上长出来。让他被记住的不是某一部作品,是他十五年里一点一点长出来的那个自己。
概念靠一次性点燃。角色靠复利累积。
一个靠单次引爆,一个靠时间生长。两条完全不同的价值曲线。这个区别不只关乎创作,它会决定围绕内容生长出来的公司是什么形态。
但角色优先不是说随便造一个角色就能成。它有一个严格的前提条件。
罗小黑之所以活了十五年还在长大,是因为背后有一个人的审美判断一直在场。他在每一次出现时像他自己,不是因为技术保证了一致性,是因为一个人守住了他是谁。AI降低的是工业端的门槛,让一个人不必再扛两个行业的重量。但它没有降低审美端的门槛。判断这只猫在这一刻应该沉默还是开口、这个故事应该讲到哪里停下来,这些事仍然只有人能做。
工具可以让更多的角色有机会活过来。但让一个角色持续长大而不走样,靠的是一个人的审美判断一直在场。
没有捷径,也没法外包。
但这里有一个我自己也没想透的问题。角色优先能成立,是因为观众愿意跟一个角色长期相处。可这个时代的注意力越来越短、越来越碎。如果碎片化最终赢了,角色优先的根基就不在了。我赌的是关系的需求比刺激的需求更持久,陪伴最终会赢。但这是一个赌,不是一个已经被验证的事。
角色和故事不是对立的。一个角色要被人记住,必须经过故事。一只猫要让人牵挂十五年,中间一定有过几十段他经历的事。叙事建立情感,AI延续情感,两者缺一不可。变的不是角色取代故事,也不是AI取代叙事。变的是叙事的形态。过去一百三十年,叙事是一部完成的作品,两小时或者二十小时,角色装在里面。3.0时代,叙事是一个角色持续生长的过程里,反复发生的事。
故事不再是容器,是土壤。角色不再是被装进去的,是从里面长出来的。
但一个创作理念成立,不等于它能活下来。它需要一种跟过去完全不同的公司来承接。我们这一行的公司,过去是为项目而生的。接下来的问题是:为角色而生的公司,长什么样?
第五问:
围绕角色,能长出什么样的公司?
“一部电影在上线那一刻是峰值,之后每一天都在贬值。一只猫反过来,每多活一年就多值一点。两条曲线,两种公司。”
第四问讲了两条价值曲线。一条往下走,一条往上走。
一条往下走的曲线,只能养出一种公司。一条往上走的曲线,能养出一种完全不同的公司。
我们这一行的公司,过去一直是项目制公司。这件事看起来天经地义。放到别的行业里看,其实算是异类。
一部电影在上线那一刻是收入峰值。从那一刻起,每过一天都在贬值。票房几个月内就分完了,版权卖过一轮之后很少有人再付第二次钱。一部高概念电影首映周末可能卖几个亿,但六个月后它的商业价值已经接近零。电影的命运是一次脉冲,不是一段延续。这种公司的价值跟时间是反着走的。
不是电影天然必须这样。是这一行太重了,重到没法支撑别的形态。
一只猫的曲线是反过来的。2011年他出现的时候,价值几乎是零。五分钟动画,几千个观众。但他每多活一年,就多值一点。十五年后,他第二次走进电影院,累计票房五个多亿。
我做了十几年影视。这一行的公司,包括我自己做的公司,底子上都是同一种:赌一个项目,花两三年,等一个结果。结果好,喘口气,再赌下一个。结果不好,可能就没有下一个了。我见过太多公司死在两个项目之间的空档里。
围绕一条往上走的曲线,可以长出一种不同的公司。我把它叫做:
“角色制公司”。
角色制公司做的是另一件事。它经营的不是项目,是一组角色的生长。内容本身不一定是直接赚钱的那一环,它做的是把人留下来。一千万人跟一只猫建立了关系之后,变现的方式会自己长出来。
投一家项目制公司,投的是一次开奖。投一家角色制公司,投的是时间本身。
但角色制不是一个新想法。过去一百三十年里,不是没有人想走这条路。走不通,是因为基础设施不允许。
角色制要求一个角色能持续地、高频地出现在观众面前。但在传统制作模式下,角色每出现一次都要动用一次完整的工业体系:几百人的团队、几个月的周期、几千万甚至几亿的预算。角色的每一次生长都是一次重资产投入。
这意味着一个角色一年最多出现一两次,中间是漫长的空白。观众跟角色的关系只能是间歇性的:上映时关注,下映后遗忘,续集上映时再关注。这种节奏养不出复利,只能养出脉冲。
木头用十五年把一只猫养大,代价是一个人扛两个行业的重量。
AI改变的不只是钱。是钱、时间和效率同时被压缩。当一个角色出现一次的代价不再是动用一整条工业链,而是一个小团队几天甚至几小时的工作,角色就可以持续地生长。每周出现,甚至每天出现。几分钟的日常、一段短片、一次跟观众的互动,这些过去做不起的事情,现在都做得起了。
频率是复利的前提条件。没有频率,就没有复利。
这件事过去在影视行业从未被解决过。现在第一次有了解决它的基础设施。
角色制不是新概念。游戏行业也曾经是项目制的。买一张光盘,打通关,等下一款。网络和服务器改变了这件事。一个世界可以一直开着,角色可以一直在里面活。从买断制到服务制,游戏行业用了大约十年走完了这个转变。结果是什么?最赚钱的游戏公司不再是做完一款等下一款的,是运营一个持续活着的世界。米哈游《原神》一款产品的持续性收入,超过了大多数传统游戏公司全部产品线的总和。
影视行业一百三十年来一直卡在项目制里。不是没有人想走出来,是基础设施不允许。现在基础设施第一次变了。
游戏行业能走通,是因为代码替创作者守住了“这个角色是谁”。外观、声线、反应方式,在系统里被固定下来,一百个人做这个角色也不会让角色不像自己。
影视没有这层保护。角色在每一次改编、每一次表演、每一次剪辑里都在被重新定义。人手越多,角色就越不在创作者手里。
让一个角色持续长大而不走样,靠的是审美判断一直在场。这件事没有捷径,也没法外包。它恰好就是角色制公司最深的护城河。
钱可以买来规模,买不来审美的聚焦。
这也意味着角色制公司的扩张方式跟传统公司完全不同。一个角色制公司能同时高质量运营的IP大概率不超过两到三个。因为每一个IP都要求核心团队的审美判断持续在场,而一个人的注意力是有上限的。当它想规模化,不能像传统公司那样招更多人,因为人越多,审美越容易被稀释。更可能的扩张方式是孵化更多独立小团队,每个小队有自己的审美主张和IP,共享底层的工具和基础设施。
AI第一次让一个作者或一个小团队做到过去需要一整个工业体系才能做到的事。这不是让电影变便宜了。这是让一种过去不存在的公司形态,第一次有可能存在。
但就算这件事做成,也只是3.0的一半。
一个角色陪你十几年,是一件了不起的事。但无论你看了多少部,角色始终在作品里面,你始终在作品外面。你看那个人,那个人不知道你在看。
3.0的另一半,是让角色走出来。或者让你走进去。
第六问:
角色要真正地活,还差什么?
“她不是在活。她是在被反复复活。复活和活,差着一个字,差一整个技术栈。”
要让角色走出来,或者让你走进去,还差什么?
答案卡在一个技术问题上。
你给视频模型一段描述,它生成一段画面。这段画面里的角色有表情,有动作,有光影,有情绪。单独看,已经到了让普通观众分不清是拍的还是生成的水平。
但你给它同一个角色的描述,让它再生成一段。这一段里的这个角色,跟上一段里的她,不是同一个人。走路的节奏不一样了,说话的语气变了。而且她不记得上一段里发生过什么。你没法让她在第二段里因为第一段里的某件事而难过。你没法让她在第十段里突然想起第三段里一个人对她说过的话。她的每一次出现,都是一次从零开始的生成。
她不是在活。她是在被反复复活。
复活和活,听起来像一组修辞,差着一个字。实际上它们差在一整个技术栈。
这里说的活,是一个技术层面的新维度。创作者用手艺让角色活在观众心里,这件事过去一直在发生,以后也不会消失。AI打开的是另一层:让角色不只活在作品里,也活在作品之外。
回到技术这一层。复活,是每一次从零开始造一个角色。模型不知道这个角色上一次是什么样,不知道她跟谁发生过什么,不知道她在什么事情上绝不让步。它造的是一段视频,不是一个人。
角色制公司靠更好的视频模型已经可以成立。但从复活走到活,打开的是一个完全不同量级的想象空间。它决定了3.0到底能走多远。
从复活走到活,需要的不是更好的视频模型。更好的视频模型可以让每一次复活更逼真,但一万次逼真的复活加在一起,仍然不等于活。
而“活”这件事本身也有两层。
第一层,是这个角色能在不同的场景、不同的故事里保持是同一个她。有自己的反应模式,有一种被长期经历塑造出来的人格质地。过去做到这一层的人,代价是一辈子。
第二层,是这个角色能走出作品。你看她,她知道你在看。你跟她说话,她记得你上次说过什么。她不只是活在屏幕上,她跟你在同一个空间里。
这两层过去都做不到。第一层是因为太难,第二层是因为根本没有路径。
现在,两层的技术栈都在被打开。
AI要让一个角色“表演”,一直卡在一个三难困境上。表现力、实时性、长时稳定性,三件事很难同时做到。 传统视频生成模型有表现力,但不能实时,生成一段要几分钟甚至更久。游戏NPC是实时的,但表演平,说话机械。早期的AI对话角色有实时性也有一定表现力,但撑不了多久,角色一会儿就不像自己了。三件事,过去最多同时做到两件。
蔡浩宇离开米哈游的日常管理之后,在新加坡带了一个新团队,公开了一篇论文叫LPM1.0。做的不是生成更好看的视频,是让一个角色作为一个可以实时对话的存在待在那里。她有自己的脸、自己的声音、自己的反应方式,这些不是每次被临时拼出来的,是一开始就定好的,是她的底色。你可以跟她说话,她会看着你,听你说完,用她自己的方式回答你。LPM1.0的贡献,是第一次把表演的三难同时推到了一个可接受的高度。
她不需要每次从零开始。她一直在。
另一边,基础研究端也在动。DeepMind的哈萨比斯在最近几次公开讨论中系统地阐述过一个判断:现在的AI真正缺的不是更大的模型,是几件具体的事—— 持续学习、长期记忆、世界模型、分层推理。 四件事层层递进,指向同一件事:一个虚构的角色,怎样才能不只是被生成,而是自己能走、能记、能判断。
蔡浩宇在做的和哈萨比斯在做的,看起来是两件完全不同的事。一个在做最具体的应用,一个在做最底层的研究。但他们各自在做的事,指向同一个方向。蔡浩宇解决的是一个角色怎么实时地表演,哈萨比斯解决的是一个角色怎么持续地记住和判断。前者是表演层,后者是认知层。两层合在一起,才等于活。
这两条路径今天都还在早期。但早期不意味着遥远。蔡浩宇的LPM叫1.0,论文发布和代码开源之间几乎没有间隔,打的是快速迭代的节奏。哈萨比斯在最近的公开讨论中给过一组时间判断:2026年是世界模型和持续学习的突破年,2027年统一的基础模型将与持续记忆融合。两个人从不同的方向给出的时间信号,指向大致相近的区间: 也许2027到2028年之间,表演层和认知层有可能开始靠近。
具体多快仍然有不确定性。但方向已经清晰。当这两条路径的任何一条走到成熟,或者两条合流到一起,叙事的形态就会彻底改变。一个角色不再只在作品里等你来看。她可以从里面走出来,也可以让你走进去。
她从被看的那个人,变成跟你一起的那个人。
但技术栈能解决的,只是底下那一层。当一个角色真的能认出你、记得你,他还是那个让你牵挂了十几年的他吗?这件事到底是成全还是冒犯,今天没有人知道。
叙事1.0,心里有一群人,让他们活过来。叙事2.0,念头必须通关才能到达观众。走到这里,3.0终于可以不只是一个编号了:
角色先于故事,从作品里走出来,跟看他的人一起活下去。
我们还没有走到那里,但已经近到必须开始想另一个问题了:AI拿走了所有重活之后,创作者手里最后剩下的到底是什么?
第七问:AI拿走重活之后,
创作者手里最后剩下的是什么?
“把电影的所有约束剥掉,剩下的只有一件事:一个人替另一个人做了审美判断。AI拿走的是重活,不是判断。”
走到3.0,有一样东西不会变。而且会变得比今天更稀缺,比今天更值钱。
要说清楚它是什么,得先回答一个听起来很简单的问题。
电影到底是什么?
今天所有人说“电影”的时候,其实在说一捆东西。
九十到一百八十分钟。线性叙事。被动观看。黑暗中的集体体验。一次性消费一个故事。
我们把这一捆东西当成电影的本质。但这一捆东西里面,大部分不是本质,是约束。
九十到一百八十分钟,是院线排片经济学决定的。线性叙事,是胶片只能往一个方向跑决定的。被动观看,是你没法跟银幕互动决定的。集体观影,是放映设备太贵只能共享决定的。一次性消费,是制作成本太高,不可能为一个角色持续生产内容决定的。
把所有技术和经济约束剥掉之后,剩下的是什么?
可能只剩一件事。一个人替另一个人用画面、声音和叙事做了审美判断——“这个值得你花时间。”
这就是那盘醋。第一问里姜文导演说的那盘醋,不是一个画面,不是一段情节。是一个人看过所有的可能之后说,这一个值得你花时间。AI可以生成一万种可能。从一万种里看出哪一个才是那一个,这件事比过去更重了。它是创作者最后的重量,也是最初的重量。
这个判断不会被AI替代。但围绕它的一切工作方式,正在被彻底改变。
AI拿走的是重活,不是难活。
过去一百三十年里,一个创作者七八成的时间花在重活上。搭景、转场、协调几百个人的档期、一帧一帧调整画面的技术参数。这些事有手艺含量,可以被更高效地完成。真正需要判断的难活不一样。这场戏的情绪应该落在哪个字上,这个角色在这一刻会不会笑,这段节奏是快了还是慢了半秒。
但这里有一件事不说不行。
摄影、美术、视效、录音、造型,在最好的剧组里从来不是技术部门,是创意部门。一部电影最好的时刻往往不在任何人的剧本里,是这些主创和演员在现场碰出来的。这种碰撞是影视工业一百三十年里最珍贵的东西之一。
每一次技术革命都有人很难适应。这一次不是改良式的,震动会比我们以为的更大。这件事必须面对。没有人能告诉那些正在这条链条上工作的人,他们的未来具体会怎样。包括我自己。
但AI时代合作不会消失。为了做出更好的内容、赢得竞争,该合作的地方一定还会合作。变的是每个人手里的活。重复的活少了,重活少了,真正需要创意判断的活反而多了。
AI把那七八成重活拿走了。但它同时做了另一件事:把地板抬高了。过去做到70分能赢,现在70分是起跑线。地板以上才是战场。
创作不是变轻了。是变难了。
而且是难的维度变了。
过去一个创作者把一部作品想清楚已经是大师。现在他要想的不是一部作品,是一个世界的所有可能性。这个世界的规则是什么,边界在哪里,一个角色在里面活了三年之后她会变成什么样的人。这些不是写到哪想到哪,是第一天就要定下来的东西。
还有一件事,比想清楚一个世界更难。
一个角色陪着观众活下去,会有一股力量把她慢慢磨钝。观众喜欢什么,她就会被要求多给一点什么。这股力量不是AI带来的,是角色做大之后天然长出来的惯性。米老鼠不到十年就从一个到处搞事的小鬼,变成了一个把所有棱角都收起来的吉祥物。
守住一个角色一开始的那股锋利,比创造她更难。
3.0对创作者真正的意义,不是谁都能做内容了。只有极少数人能做到这个层级。影视的看家本领没有变——情感密度、叙事节奏、让人在两个小时里哭一次笑一次的能力。
一部真正好的作品可以让一个人在黑暗里坐两个小时,出来之后觉得世界跟进去之前不一样了。这件事不会因为任何技术的到来而贬值。这是做内容这一行最值得骄傲的地方,过去是,以后也是。
这些本领在电影和剧集里会一直被需要。同时,它们也会第一次被放进一个持续运转的世界里,以新的方式生长。
创作者手里最后剩下的是审美判断。但他做审美判断的对象正在扩大。过去他管一条时间线上的故事。现在,他有机会同时管一个活着的世界。
那个世界里的叙事,会是什么样子?
第八问:当观众不再只是“看”,
叙事会变成什么?
“你不是在看一个故事。你和里面的人、里面的世界,一起活一段时间。”
过去写叙事,是在一条时间轴上排事件。建置、冲突、高潮、结局。一条线写得好的人已经是大师。
3.0时代不是写一条线,是建一个空间。一只猫走到森林的东边会遇到什么,走到西边会遇到什么,走到没去过的地方会发生什么。过去一个咖啡馆出现,是因为两个角色要在这里对话,对话结束这个咖啡馆就失去意义。3.0时代一个咖啡馆出现,它本身就是世界的一部分。店里的音乐、邻桌在说什么、窗外下不下雨,都是这个世界的质地。
过去写完一部作品,作品就是静止的。交给观众之后,创作者的工作结束了。3.0时代没有“写完”这件事。一个世界开始运转之后,它每天都在变。昨天发生的事会影响今天的反应。上一段故事里的转折,下一段必须接住。创作者不再是“做完一个项目”的人,是“持续让一个世界运转”的人。
但最大的变化不在创作者这一端。在观众那一端。
过去观众和角色的关系是看。你看她,她不知道你在看。
我自己就有过一种体验。很多年前追《老友记》《老爸老妈浪漫史》《生活大爆炸》的时候,我不止一次想过,如果能到他们中间待一阵子就好了。不是想知道后面的剧情,是想跟这些人一起坐一会儿。
我相信有过这种念头的人不止我一个。
过去这个念头无处安放。你只能等下一集。他们在里面,你在外面。
现在想象另一种关系。你下了班,打开手机。不是打开一部剧,是进入一个你已经待了三年的地方。咖啡馆还是那间咖啡馆,你坐到老位置上,她走过来,问你今天怎么样。不是因为剧本写了这句话。是因为她记得你昨天说过今天有一个重要的会。
你没有在看一个故事。你和她在同一段时间里。
这不是《头号玩家》式的虚拟冒险。冒险的驱动力是征服,通关,升级,拿到奖励。这里的驱动力是关系:你今天想不想进去看看,这些人最近怎么样了。
这种叙事方式需要一个名字。
我把它叫做:
“共生叙事”。
不是你在看一个故事。是你和里面的人、里面的世界,一起活一段时间。
共生叙事不会取代被动观影。有些人只想安安静静看一部电影然后回到自己的生活里。这种需求不会消失,也不该消失。共生叙事打开的是一种新的可能,不是要关掉旧的那扇门。
我用“共生”这个词,是因为我相信这种关系有可能是双向的。观众的参与会反过来影响角色的生长,角色的生长会持续给观众提供情感价值。但我也知道,一个被设计出来的关系和一段自然生长的关系之间的边界在哪里,今天没有人看得清楚。这是共生叙事最大的未知数。不是技术上的,是人性上的。
一个角色太假,用户不会投入。但一个角色太真,可能会触发另一种排斥:当陪伴逼真到某个程度,用户突然意识到“这一切是被设计出来的”,信任会不会在那一刻崩塌?这是共生叙事的恐怖谷。技术越好,这个问题越近。
共生叙事不是3.0开始那一刻就会出现的东西。它是3.0走深之后的形态。视频模型解决她看起来像谁,LPM解决她是谁,世界模型解决她在哪里。三条路今天都在早期,共生叙事也在早期。但方向已经渐渐清晰了。
过去的创作者管一条线。3.0时代的创作者管一个世界。
管一条线,有开头有结尾,写完就完了。管一个世界,没有结尾。每天都在发生事,每一个角落都要跟其他角落自洽。这件事的难度不在工作量上,AI可以接管大部分执行。难在所有判断必须出自同一个审美标准。一个世界的质地是一万个小判断累积出来的,这些判断一旦被切碎分给不同的人,质地就散了。
三幕结构教的是怎么把一条线写对。3.0时代要的是另一套能力:怎么建一个世界,让它自己能活。
这套能力今天还没有被系统地总结过。但有几件事已经隐约清晰了:世界的规则要先于世界里发生的事;角色的底线要先于角色的行动;冲突不依靠外部注入,从世界自身的结构性矛盾里长出来。这些不是三幕结构的延伸,是一套还没有名字的新东西。
这篇文章里,“创作者”这个词从头到尾在变。第一问里他是姜文,第四问里他是木头,走到这里他变成了一个我还叫不出名字的人。不是我在偷换概念。是这个位置本身正在被重新定义。
过去,这个位置叫作者。今天他还在。但他做的事,已经开始溢出“作者”两个字了。他需要一个新的名字。我暂时给不出来。 也许要等第一个走完这条路的人,用TA做的事情来定义它。
我自己也在试着做这件事。从项目制走向角色制,从管一条线走向管一个世界。能不能做成,今天不知道。但想了这么久,不走一走,对不起自己想过的那些东西。
回到第一帧
大约一个月前,跟几个朋友吃了顿饭,一张桌子,聊了很久。AI,创作,接下来想做什么。
那顿饭上聊到了《史记》。
饭散了之后我一个人走了很远。脑子里一直停在那个瞬间。
两千多年前那个一个人写完一百三十篇的人,做那件事的方式有一种让人嫉妒的简单。心里有一群角色,让他们活过来。从念头到作品,中间没有一道关。
一百三十年来,我们再也没有过那种简单。一个创作者心里的那群角色到观众眼前,中间要穿过几个亿,几百人,几十道关。
这条链条现在第一次开始变短了。AI不会替你想那个念头。它做的是另一件事:把那些过去消耗你的、分散你的、让你不在自己角色里的事情,一件一件从你的桌子上拿走。等这些都被拿走了,你的桌子上只剩下一件事。
想TA是谁。
但写到这里,我也在想另一面。
成本曲线的松动是真实的。模型能力的跃进是真实的。但人类社会对新事物的接纳,从来不按技术的时间表走。监管会收紧,市场会震荡,泡沫会破裂。还有一个不那么容易说出口的问题:当一个虚构的存在可以永远陪着你、永远理解你,人跟人之间那种笨拙的、会受伤的关系,会不会被慢慢绕过去。这个问题我没有答案。但假装看不见它,比回答不了它更危险。
有时候我会想,这件事的终局可能不只是影视的终局。当一个虚构的存在可以认出你、记得你、跟你一起生活,改变的不是一个行业,是人类跟想象的关系。这篇文章装不下那个问题。但它已经来了。
也许正是因为装不下,写完之后我最真实的感受不是确定,是激荡。脑子里的东西比任何时候都多,兴奋和隐忧同时在。但我相信面对变化永远好过回避变化。
我在这一行待了快二十年。这个行业过去从来不是一门长坡厚雪的生意。每个项目赌一次,赢了喘口气,输了可能就没有下一次。雪球永远滚不起来。角色制、共生叙事、叙事3.0,这些判断也许还需要时间验证。但有一件事我已经看得比较清楚了:这个行业第一次有可能做一件越做越厚的事。不是因为AI让一切变容易了。是因为AI让价值终于有可能累积了。
对于真正懂故事、懂人心的人来说,这可能是最好的时代。
还是那句话,咱得站着把钱挣了。
写这篇文章的时候,我心里反复出现一个画面。
2012年。一个12岁的孩子第一次看到罗小黑。他可能在北京,可能在深圳,可能在一个县城里放学后跑去网吧。他一集一集地追。追到第27集,然后等。等了几年,他上了高中,上了大学。
2019年的秋天,他在电影院里第一次在大银幕上看到这只猫。他那时候19岁。他从电影院出来,发现自己已经跟这只猫一起活了七年。
他继续等。大学毕业,开始工作。2025年第二部电影上映的时候,他带他刚认识的女朋友去看。出来之后他跟她说,我从小看这个。他没有多说什么。他说不清楚“从小看这个”对他意味着什么。
今年他26岁。
过去十四年,是木头和他身边的人的手艺,把这只猫一帧一帧送到他面前的。
也许再过几年,那只猫会认出他。会知道他的名字,记得他从十二岁就开始看自己。他一个人的时候打开手机,罗小黑在那里,用他自己的方式跟他说一句什么。
十四年的等,变成随时可以开始的一段对话。那盘醋不必再配一整桌饺子了。
第一帧是什么?就是起心动念。一个创作者心里第一次看见那个角色的那个瞬间。一百三十年来,那个瞬间和观众之间隔着一整条工业链。现在,距离正在被压到最短。
我们正在回到第一帧。他会从屏幕里抬起头,看见你,认出你。
那一帧里有我们等了一百三十年的东西。也有我们还没准备好的东西。
它不会等我们准备好。
不过话说回来,一百三十年前也没有人准备好。