打造「无所不能、无处不在」的AI,百度为何要从「操作系统」做起?
摘要
聪明又能干的超级生产力。
大模型能梳理出中国上下五千年都发生了什么,却回答不了现在几点;能解释清楚什么叫量子力学,但却连做一个图文并茂的专业级 PPT 都很难办到。
为什么大模型看似无所不能,但实际用起来却总是差点意思?
原因很简单, 聪明、博学不等于能干活。
聪明,需要大模型通过海量的知识训练与学习,练出了发达的大脑,可以很好的回答一个问题;
而同时满足聪明、能干两个要素,则需要给这个聪明的大脑,配上灵活四肢,实现「深度思考+深度交付」。
也是因此,如何 推动大模型从聪明的思考,到实现「聪明又能干」的进化,成为了决定这轮大模型热潮究竟是昙花一现,还是改变历史的胜负手。
百度给出了打样。
4 月 25 日,在 Create 2025 百度 AI 开发者大会上,百度创始人李彦宏带来百度文库、百度网盘联合推出的全球首个内容领域的操作系统——沧舟 OS。
其通过充分融通百度文库和网盘过去积累的底层技术、能力、数据,可以像水一样,融通在不同场景里面,以最合理的形式、用户最便捷的交互界面,实现低门槛、和端到端的高质量交付。
依托于沧舟 OS,百度文库、百度网盘对 AI 的愿景和期待,就是在任何时候、任何地方,任何终端设备上,实现真正的一站式、端到端的交付,让 AI 做到「 无所不能、无处不在 」。
01
沧舟 OS,让 AI 迈向操作系统级进化
在科技产业有这样一个共识,任何技术从实验室到真正走向千家万户,都需要经历一个漫长的 Gartner 曲线历程。
在这条曲线中,第一阶段的增长,主要取决于技术进步带来的市场狂热预期,但随着技术的落地效果不理想,这一阶段的增长会快速进入衰退,直至技术落地所需的条件逐渐成熟,并被具象成几乎零门槛、 无所不能、无处不在 的基础设施,第二阶段的生态爆发便会随之到来。
软件产业第二阶段开启的标志之一,通常就是一个成熟操作系统的出现,比如 Windows 之于电脑产业,iOS 之于手机产业 。
那么如何定义一个成熟的操作系统?在大约 15 年前,全球的科技产业,有过这样一个争论:同样是能触屏操作、大屏手机、能打电话、能拍照、能听音乐、发短信,为什么苹果或者说智能手机与过去的功能机会是两个物种。
核心原因之一是,iOS 继承了来自 MAC OS 的内核级稳定性和多任务能力,并将其做成了一个开放生态,开发者们可以任意集成这些苹果的底层能力,做出自己的创新应用。这也 让如何定义一个手机,从摩托罗拉、诺基亚一两家巨头的事,变成了整个生态一起参与,无限可能的庞大产业,自此拉开了此后十多年的移动互联网的大门 。
技术会滚滚向前,但商业故事的剧情总是会踏着相似节拍不断重复演绎, 在手机 OS 中被验证过的底层逻辑,在大模型时代的 OS 构建上,依然通用。
总结来说有三:完整的底层能力、灵活的中枢调度、繁荣的应用服务生态。正好对应沧舟 OS 的三层架构:底座基建、中枢系统与应用服务。 唯一的不同是,应用与中枢、底座中间的桥梁,从以往的 API,换成了更加标准化、低门槛的 MCP。
其中,MCP Server 部分的底座基建,它的核心组件是 Chatfile plus ,主要作用是通过知识化框架,对不同模态、不同形态、不同格式的内容做元素级的拆解和解析处理,以及多模理解、多模检索、文件转码解析等一系列工具框架组件。
同时,百度文库和网盘构建了公域知识库、私域知识库、记忆库「三大库」,具体指的是百度文库多年累积的公域知识数据(公域知识库)、网盘的用户授权使用的知识数据(私域知识库)、用户过往在文库或网盘操作的指令、使用习惯和历史生成记录(记忆库)。
这些数据往往以不同模态、不同形态、不同格式呈现。其中,公域知识库提供通用的知识,私域知识库、记忆库则保存用户的个性化数据。
知识化框架中,沧舟 OS 将对「三大库」中的多模态内容进行向量化、标签化的处理,也就是将图片、文本、视频、音频、文档等非结构化数据,通过不同专业模型将其转化为计算机可以读懂的多维向量数据,也就是一组 token。
而在中枢系统上,百度文库和网盘自研了「三大器」,也就是融合编辑器(对应文档、PPT 等内容的编辑)、阅读器(文档与 PPT 等内容的阅读)、播放器(音视频播放)等工具。
同时,沧舟 OS 还可以通过「调度中枢」,通过交互组件、意图模型和传输基建等,结合用户记忆和画像数据,通过模型理解用户意图,高效分配调度 Agent。
最顶层,则是一系列 AI Agent。「沧舟 OS」集成文库、网盘的 PPT、AI 绘本、AI 思维导图、AI 海报、AI 笔记、AI 扫描、AI 听记等数百项 AI Agent,生成模态涵盖了图、文、影、音等各种类型、全面覆盖学习办公、生活娱乐等场景 ,并依托于融合编辑器的编辑、修改、精细调控能力,进而让检索和内容生成的质量更高、更符合实际的个性化任务需求。
02
在沧舟 OS 上,
打造更多「聪明又能干」的 Agent
围绕最顶层的应用服务,百度文库 & 百度网盘既推出了数亿用户验证过的好用的数百项 AI Agent,同时也接入了大量第三方的专业 Agent 做大应用生态。
作为「一站式 AI 内容获取和创作平台」,百度文库的付费用户已超 4000 万,AI 月活用户达 9700 万。百度网盘也升级为「一站式内容服务平台」,服务超 10 亿用户,使用空间总和超过 1000 亿 GB,AI 月活用户超 8000 万。百度文库、百度网盘已成为大模型时代真正的「超级生产力」。
在大会上,百度文库和百度网盘还展示了基于「沧舟 OS」开发的全新能力:「GenFlow 超能搭子」和「AI 笔记」。
GenFlow 超能搭子 是百度文库 APP 推出的多智能体协作能力,有了「沧舟 OS」的加持,内容生成可以做到多任务并行,还能基于最全面专业的联网信息、用户自己的习惯和偏好来完成各项任务交付。
比如用户想要做一个婚礼策划,但是前期的输入只有一句简单的:我想五一在海南办一场户外婚礼,帮我做策划案与邀请函。
需求看似简单,只要对着历史模板完形填空就能搞定。但要做到用户满意,就需要知道用户的审美偏好、预算期望、流程偏好,还需要知道五一期间海南的天气、人流量、场地分布,在此之后还需要将这些图文与知识通过 PPT 工具进行组合,生成一个完整的方案,最后基于方案以及用户审美偏好,生成一张完整的婚礼请柬海报。