超越自动化:物理人工智能开启智能机器的新纪元
如果有人今天从Spanx LLC的网站上订购塑形衣,一台类人机器人会处理该包裹。 在佐治亚州的GXO Logistics配送中心,Agility Robotics Inc.的双足机器以机械般的精度推动商品运输。在宝马集团斯帕坦堡工厂,Figure 02机器人将钣金零件插入底盘组件时实现了400%的速度提升。
这些不是实验室演示或风险投资的狂热梦想。它们是创造收入的部署,标志着机器与我们物理世界互动方式的根本转变。
智能机器 人时代已经到来。先进的硬件现在通过视频、音频和传感器阵列将人工智能模型与现实世界连接起来,使人工智能能够控制从装卸货物的自主托盘千斤顶到能够精细运动和工具作的人形机器人。这种变革远远超出了工厂车间——涵盖了在城市街道上行驶的自主车辆、响应使用者的智能建筑,以及智能耕作的农业机器人。
这场革命由所谓的“ 物理人工智能 ”(Physical AI)的出现推动:将人工智能集成到物理系统中,使机器人和机器能够实时感知、推理并适应现实世界。与遵循僵化编程的传统 自动化 不同, 物理人工智能 系统结合复杂算法、传感器和执行器,以导航不可预测环境并处理可变任务。
亚马逊机器人首席技术专家Tye Brady说:“我们在打造身体方面已经非常出色了。”“现在我们通过生成式人工智能将心灵带入身体。”
为了了解实体人工智能如何重塑整个行业,并评估人工智能何时能在工厂、企业和家庭中大规模实现,SiliconANGLE采访了顶尖专家和高管,探讨该技术从实验性好奇心向商业必需性的转变。
“ 物理人工智能 已达到一个关键转折点,技术准备度与市场需求保持一致,”先进机器人解决方案领导者Teradyne Robotics首席人工智能官James Davidson表示。“市场动态已从怀疑转向证据。早期采用者报告了切实的效率和收入增长,我们已进入我所称的早期多数阶段,投资规模大幅增长。”
这种剧烈的规模化也反映在风险投资流入中。根据Mind The Bridge的最新分析,硅谷几乎完全将投资策略转向人工智能,93%的风险投资现流入与人工智能相关的初创企业。仅2024年,实体人工智能公司就吸引了超过75亿美元的资金,超级轮次成为常态:杰夫·贝索斯支持的Physical Intelligence公司以24亿美元估值筹集了4亿美元,市值24亿美元,规模为Figure AI Inc.。 获得了6.75亿美元,Skild AI完成了一轮3亿美元的融资。
这一势头在2025年更加加速。Figure AI在九月又筹集了10亿美元,Physical Intelligence回归又筹集了6亿美元,而开发能够导航三维环境人工智能模型的初创公司General Intuition PBC在十月筹集了1.337亿美元。普罗米修斯计划是一家由贝索斯和连续创业者维克·巴贾伊共同领导的初创公司,旨在开发“为物质经济打造人工智能”,筹集了惊人的62亿美元资金。
据金融研究公司Crunchbase称,2025年前七个月已有超过60亿美元的资本流入机器人公司和初创企业。Crunchbase预测,照这个速度,今年的资金将超过2024年的水平。
物理人工智能的快速发展得益于机器人基础模型(RFM)的发展:这些人工智能软件“大脑”能够接收信息并运用推理来指导现实世界中执行的机器人动作。
这些模型通常建立在视觉语言模型之上:具有多模态能力的预训练变换器模型,能够感知世界,并使机器人能够识别物体和理解物理。RFM种类繁多,从物理智能(Physical Intelligence) 针对多种机器人的通用π0模型,到英伟达公司的GR00T——一种适用于类人生物的通用模型。
催生这些模型的技术突破是视觉-语言-动作模型(VLA)。Google DeepMind于 2023年开发的机器人变压器2,通过扩展两种最先进的基础模型——PaLI-X和PaLM-E,树立了 智能机器 人学的范式。VLA基于庞大的机器人动作数据集进行训练,使其能够推广到新的任务。
VLA使机器人能够将提示转换为动作,例如,“请收拾垃圾并丢弃。”模型的训练数据既提供了关于物体外观的知识语料库,也提供了一套用于处理动作的机器人轨迹。在这种情况下,即使机器人没有专门训练来丢弃垃圾,它仍然可以通过摄像头识别为“垃圾”,抓住它们,找到合适的垃圾桶并执行处理。
这一发展标志着从基于规则的指导——机器人肢体触发预编程动作——向能够智能判断和执行动作的计算机推理的根本转变。
为了训练和准备这些模型,出现了一类新的专业人工智能模型:世界基础模型。WFM为机器人AI承担两个主要功能:它们使工程师能够快速开发庞大的合成数据集,以训练机器人执行看不见的动作;以及在实际部署前在虚拟环境中测试这些机器人。
WFM允许开发者通过环境的“数字孪生”创建模拟现实的虚拟训练场。在这些模拟场景中,机器人学会以远超物理存在所能承受的速度安全应对现实世界的挑战。
例如英伟达的Cosmos平台,开发机器人和自动驾驶车辆的WFM,以及Waabi Innovation Inc.的Waabi World,一款旨在教授自动驾驶卡车AI模型如何安全驾驶多种路况的WFM。World Labs Technologies最近推出了Marble,一款完整的虚拟世界生成器,谷歌的DeepMind推出了Genie 3,一款能够生成互动虚拟世界的AI模型。
“Cosmos通过指数级扩展现有数据,解决了关键的模拟到现实挑战——虚拟训练与现实世界复杂性之间微妙但显著的差异,”Nvidia机器人产品经理Spencer Huang表示:“Cosmos通过指数级扩展现有数据和解决关键的模拟现实挑战。
人工智能先驱Yann LeCun离开了Meta Platforms Inc. 他选择一家开发WFMs的初创公司,因为他认为世界模型将比Meta专注于语言模型的方向,在推动人工智能行业发展的方面有更大进展。
能够生成大量物理精确的训练数据,对行业来说是一个分水岭。传统机器人需要繁琐的真实世界数据收集——昂贵、危险且范围有限——而WFM则能在收集数百个训练场景的时间内产生数百万个训练场景。
Waabi首席执行官Raquel Urtasun解释道:“我们构建元宇宙是为了自动驾驶。”“Waabi World就是那个以现实为基础构建的世界模型,这对物理人工智能对抗幻觉等你不希望出现在模拟系统中的现象非常重要。”
Waabi的方法实现了前所未有的99.7%模拟真实度,证明虚拟训练环境现在可以近乎完美地模拟物理世界。
WFM还将 智能机器 人产业扩展到机器人肢体、无人机和类人生物之外。由于WFM创建了现实世界的“数字孪生”以模拟和理解真实环境,它可以训练任何类型的机器人,甚至包括传统上不被视为机器人技术一部分的系统,如物联网网络、智能建筑和智能城市。
原型人工智能公司一家开发物理人工智能基础模型的公司,创造了Newton模型,该模型旨在实时理解和推理物理世界。与其他模型不同,Newton将实时传感器数据与自然语言融合,传递关于世界的洞察。其应用涵盖制造业,监控员工安全并预测设备维护,分析交通路口以设置更安全的斑马线,并提升大型建筑工地的安全。
过去两年,人形机器人首次商业化部署,包括宝马工厂和GXO物流仓库的部署。2024年6月,人形机器人首次投入商业运营,Agility Robotics的Digit正式进入“劳动力市场”。
尽管人形机器人占据了大量头条新闻,但它们仅占人工智能机器人应用中的一小部分。 目前,正是协作机器人、机械臂和自主移动机器人正在改变仓库和工厂环境。最典型的例子是 Amazon.com 公司,其仓库中使用智能机器人。在公司超过75万台机器人中,亚马逊推出了Vulcan,这是一款具备触觉的AI驱动机械臂;Cardinal,用于叠加包裹;以及Proteus,一台能移动推车的自主移动机器人。
“以前是有可能做到的......但你需要一个高度训练的计算机模型,“戴维森补充道。“现在你可以让物理或生成式AI模型帮你创造,完全不用训练。”
摩根士丹利分析师估计,到2030年,亚马逊的机器人技术开发每年可为公司节省多达100亿美元。这还没涉及大量不断反馈到物理模型的数据,这些数据在业界可能无可匹敌。市场分析师Grand View Research的一份报告估计,2023年全球人工智能机器人市场规模为128亿美元,预计到2030年将达到1248亿美元。
2024年,工业机器人占据了机器人人工智能市场的68%,全球工厂安装基数达428万台。医疗和医疗机器人是增长最快的细分市场,预计增长率为26%,计算机视觉辅助手术系统和自主医院物流机器人正迅速发展。
然而,现实依然复杂。Tria Technologies GmbH软件开发实验室负责人塞德里克·文森特给出了令人警醒的评价:“虽然你可能在网上看到工业机器人搬运箱子的视频......但当涉及到类人机器人模拟人类活动时,如果你仔细观察,会发现它们经常失败。”
“机器人还不能持续包装产品”,因为这需要判断力,而机器人系统尚未具备,Amazon.com 公司机器人入职主管伊戈尔·佩丹说。这就是为什么如今的先进技术是单臂或机器人群,而非类人机器人。
文森特补充说,对于强大的人工智能系统,“需求无疑是工业机器人的应用,这也是一个很好的概念验证。你在Nvidia身上也能看到这一点,但目前还没有什么'真正'的东西。”事实上,SiliconANGLE的姊妹市场调研公司theCUBE Research指出,由于物理AI模型尚未拥有大型语言模型那样庞大的数据库,它们在类似能力方面可能至少落后两到三年。
演示与部署之间的这种差距解释了为什么正如戴维森所指出的,企业应“关注现有的,而非仍在出现的”。
自动驾驶汽车还受益于物理AI的突破,包括AI模型和硬件,Waabi计划在今年年底前使用其下一代基础模型推出完全无人驾驶卡车。像Aurora Innovation Inc.这样的公司。 以及Torc Robotics Inc. 最近还推出了德克萨斯州固定路线和美国公共道路上的无人驾驶卡车商业试点服务,为FedEx和Uber Freight等合作伙伴运输货物。
自动驾驶汽车市场反映了这一加速趋势,市场分析师Grand View Research Inc.预计该行业将从2024年的680.9亿美元增长到2030年的2143.2亿美元。
英伟达的Drive Thor平台将于2025年推出量产车,已获得梅赛德斯-奔驰股份公司、捷豹路虎汽车股份有限公司、沃尔沃汽车股份有限公司以及中国电动车制造商理想汽车公司、吉利控股的Zeeker和小米公司在内的主要制造商的采用。该平台能够将多种车辆功能——从自动驾驶到AI驾驶舱功能——整合到单一的片上系统,吸引了既有的汽车制造商和机器人出租车公司,如Uber Technologies Inc.。
卡车运输领域尤其展现了商业可行性。麦肯锡公司 这些项目认为自动驾驶卡车通过运营成本优势,到2035年有望创造6000亿美元的市场。普华永道和制造业协会估计,如果积极采用自动驾驶长途卡车运输,制造商到2040年将节省近30%的总运输成本。
“如果你看看今天的人类司机,虽然他们平均能开11个小时,但实际上只开了6个半小时......“突然之间,自动驾驶可以全天候使用你的资产,”乌尔塔松谈及经济性时说。
英伟达首席执行官黄仁勋宣称,实体人工智能开启了“人工智能的新纪元”,这一大胆宣言如今得到了具体的技术突破支持。英伟达的愿景超越了孤立的 自动化 ,实现了根本性的变革。
“大型语言和生成模型的进步预示着人工智能的新时代——能够推理物理世界,并在工厂、家庭和城市中无缝运行的系统,”Nvidia的Spencer Huang补充道。“有了'机器人大脑',可以在真实或合成数据中重新训练模拟,机器人可以快速学习新技能,并被重新应用于各种应用。”
这种适应性代表了对数十年来主导机器人的狭窄预编程系统的巨大转变。
“到2027年,叙事将不再是关于人类替代,而是关于增强作,人工智能驱动的物理系统作为工具,增强而非取代人类专业知识,”Synapse(Capgemini Invent旗下)人工智能与数据主管兼总监Mat Gilbert说。
吉尔伯特补充说,人类劳动将从重复的体力劳动转变为与智能系统舰队并肩工作和监督。这一变化的根本在于人工智能驱动的机器人系统如何处理多变且无结构的环境,而这直到最近还仅由人类工人负责。
吉尔伯特说:“关键的业务差异化将是谁具备部署和适应智能的技能,而能够蓬勃发展的企业将是那些学会快速教授、管理和信任其员工机器人组成部分的企业。”
劳动力取代的问题为实体人工智能的商业演变投下阴影,尽管早期证据表明现实比末日新闻所暗示的更为复杂。世界经济论坛2025年《就业未来报告》预测,到2030年,人工智能和 自动化 将创造全球1.7亿个新岗位,同时取代9200万个岗位,净增加7800万个岗位。高盛估计,6%至7%的美国劳动力面临AI采用带来的取代风险,尽管随着新机会出现,这种影响似乎是“暂时的”。一项针对52项工业机器人研究的荟萃分析未发现普遍工资低迷的一致证据。
对于企业领导者来说,吉尔伯特将这一转变描述为“增强运营而非人类替代”。中国200亿美元的人形投资凸显了利害关系:尽管官员承诺合作而非替代,中国1.23亿制造业工人仍面临真正的不确定性。
历史证明,这些担忧并非毫无道理。从之前的自动化浪潮——从织机到工厂车间——的教训表明,技术取代往往比技术人员预测的慢,但比工人在没有制度支持的情况下再培训的速度快。
通往这一转变的路径已经被绘制出来。黄斯宾塞观察到,虽然“大多数机器人仍处于狭窄的预编程状态”,但一波新兴公司已经开始部署可适应系统。有些专注于构建可通用的“机器人大脑”——如Nvidia、Field AI和Skild AI,而另一些则开发实体平台——如Figure、Agility和Universal Robots A/S。
Gilbert表示,短期内(两到三年),最直接的价值将来自应用开发者和加速高价值用例开发的公司,如仓库物流,而硬件和平台提供商则将缩小潜力与生产之间的差距。从长远来看,五年内,价值将转移到平台提供商以及机器人动作、仿真和训练的主导基础模型制造商身上。
戴维森指出:“物理人工智能的成功将取决于四个关键因素:易用性、可靠性、多功能性和性能。”