具身智能的商业化,从在春晚舞台上「倒酒」开始
不知不觉中,机器人已经连续两年在春晚跳舞了。
要说今年有什么新的变化,首先是机器人参演的节目更多、演出效果更好了。毕竟上春晚的机器人厂商从一家增加到了四家,一年的技术迭代也为机器人“解锁”了更多技能。
其次,春晚机器人的影响力更大了。雷峰网发现,从几个月前开始,拿到春晚“门票”的公司就被相继曝出,春晚直播时关于机器人的讨论也此起彼伏,“出圈”的程度比去年更甚。
随着相关话题接连登上热搜,网友的讨论分成了鲜明的两派:有人惊叹于机器人丝滑的动作与零失误的稳定发挥,也有人抛出了那个老生常谈的问题——机器人跳舞,到底有什么用?
的确,能不能商业化,向来是大家对科技产品的价值判断标准之一。机器人现在还只是一个用来表演的道具吗?对于这些参加春晚的公司来说,表演确实提升了知名度,但能够转化为实际的订单吗?
这些讨论的背后,是大众对具身智能产业最核心的追问:走出实验室、离开聚光灯,机器人到底能不能做成一门可持续的好生意?
春晚街舞大秀,机器人的商业化“成人礼”
从机器人由“产品”走向“商品”的过程中,“跳舞”本身的意义其实被大大低估了。
在很多人的固有认知里,机器人跳舞只是博眼球的舞台花活,与商业化落地毫无关系。但事实恰恰相反,能否完成流畅、高难度的舞蹈动作,不仅是机器人综合能力最直观的试金石,更是决定其能否商业化的必要条件。
首先,机器人在春晚跳舞,并不意味着它们仅仅只会跳舞,而是舞蹈这种表现形式与春晚的氛围最为契合。而且哪怕是跳舞,对比去年春晚舞台上机器人的表现,今年的机器人已经在动作复杂度、完成度与稳定性上,实现了肉眼可见的飞跃。
以魔法原子的MagicBot Z1为例,这款人形机器人在春晚主会场与易烊千玺、陈小春等艺人同台演绎的《智造未来》节目中,完成快速转向、跃动衔接等零误差协同动作,同时在宜宾分会场展示了托马斯360°回旋、侧空翻等国际赛事级特技。
以托马斯360°回旋为例,一个动作事实上包含支撑、摆腿、腾空、旋转、再支撑等多个非连续相位,机器人需要在单臂支撑和完全腾空的状态间快速、平稳地切换重心。这要求所有关节(特别是肩、髋、膝、踝)必须进行毫秒级的精确协同运动,对整机协调、重心管理和瞬时动力分配有着极高要求,需要长期的技术积累。
可以说,这个动作是机器人动力学、高精度传感、实时控制算法和强大硬件驱动能力的综合试金石。即使对人类来说,不经过专业的训练也难以完成。
而Z1之所以能像运动员一样丝滑地完成这些动作,靠的是硬件性能与运动控制算法的双重突破。
硬件层面,自去年7月Z1正式发布,背后的团队几乎以“周”为单位持续对其进行验证与迭代,将整机结构强度、关节模组峰值扭矩与响应速度极致提升,使机器人拥有了强劲的“骨骼”和“肌肉”以承受高速起跳。
软件层面,团队构建了覆盖真实场景的数据采集体系与动态训练框架,基于模仿学习的控制方案,使机器人在不断试错中成长,逐渐掌握高难度动作的技巧。
所以,机器人在春晚跳舞,本质上是对其技术实力的集中展示。尤其是其中的运动能力,可谓机器人商业化的核心前提。
我们常说的“具身智能”,就是让数字世界的智能在物理世界中拥有行动载体,而运动能力,正是智能与物理世界交互的基础。机器人的“智能”从来不是孤立的算法能力,而是感知、决策、行动的完整闭环——如果连自身的肢体都无法精准控制,再强大的大模型也无法落地到真实场景中。
因此,无论是与人面对面的交互动作,还是在不同场景中完成指定任务,都需要以成熟、稳定的运动能力作为底层支撑。
更重要的是,强大的运动能力,直接决定了机器人商业化的边界。只有具备了全地形适应能力、高动态运动能力与复杂姿态控制能力,机器人才能够走出平整的实验室,真正进入人流密集的商业街道、地形复杂的野外环境,甚至是布局零散的家庭场景,去适配更多元的商业化需求,而不是永远困在固定场景里做简单的重复动作。
即便退一步讲,跳舞本身也不失为一门成熟的生意。很多人忽略了,文娱展演是一个规模庞大且需求持续增长的市场,从文旅景区的常态化演出、商业综合体的主题活动,到综艺节目的舞台表演、品牌发布会的创意呈现,都对机器人表演有着明确的需求。
不同于传统的演艺形式,机器人表演兼具科技感与话题性,能够快速吸引流量、打造记忆点,而春晚舞台上所展现的高难度、高稳定性的群控表演能力,更是直接打开了机器人文娱商业化的天花板。
百台四足机器人协同完成整齐划一的舞蹈动作、人形机器人与明星同台完成歌舞表演,这些在春晚上验证过的能力,完全可以快速复用到各类商业展演场景中,形成可落地、可复制的商业化模式,这本身就是具身智能商业化的重要组成部分。
跳舞之外,机器人捞面、倒酒才是春晚重头戏
当然,机器人的商业化不能只靠跳舞,“干活”才是重中之重。那么,现在的机器人究竟能干哪些活?对于这个问题,我们也能从春晚中找到答案。
雷峰网 (公众号:雷峰网) 观察到,当机器人跳舞被大众讨论得热火朝天之时,不少业内人士却把注意力放在了另一个没那么出圈的镜头上。除夕当晚一些具身智能社群中,也都流传着一些春晚机器人“端面倒酒”的截图。
原来,在春晚宜宾分会场,MagicBot Z1的“兄弟”MagicBot Gen1 化身“赛博捞面师”,将当地特色燃面捞进碗里,再由Z1端起来送到演员魏翔手中。Gen1不仅捞面、起面、倒面的动作一气呵成,十分干脆利落,随后更是展示出“倒酒”的绝活,将宜宾五粮液一滴不撒地倒入杯中,引来观众阵阵掌声。
虽然捞面、倒酒给观众的视觉冲击力不如跳舞,但其中的“含金量”在内行看来却有目共睹。一方面,这是春晚首次上演人形机器人在真实场景多机协作,一大一小两种机器人分别负责精细操作和末端服务,这种链路化协作让机器人深度参与服务流程,为商业化提供了更广阔的想象空间。
另一方面,捞面、倒酒这些看似简单的动作,却对机器人有着相当高的技术要求,机器人不仅需要完成基础肢体运动,更要具备精准的精细操作、环境感知和实时决策能力。
倒酒对机器人来说有多难?首先酒是一种透明的液体,感知的难度远比一般的固体要大;其次倒酒的过程中,随着水位的变化,酒的流速、落点都会发生变化,需要实时做出反馈;在此基础上,手和臂还不能过度抖动,防止酒洒出来。捞面看起来似乎简单一些,但面是一种柔性物体,再加上捞面的工具延长了机器人的操作末端,因此也并非易事。
那么,春晚机器人是如何做成的呢?答案是一套从数据采集到模型训练的完整技术路径。Z1和Gen1背后的工程团队通过动捕系统采集人类动作数据,在仿真环境进行大量动作强化和稳定性训练。等到完成仿真验证,再迁移至真实机器人执行,最终借助zero-shot泛化能力适配不同的真实环境,从而将实验室的成功案例复刻到春晚舞台。
另外值得一提的是机器人的“手”。机器人精细操作能力的上限是由末端执行器——灵巧手所决定的。本次完成操作的Gen1搭载自研的高性能触觉灵巧手,可精准控制抓取力度与轨迹,这种硬件基础,让机器人能够模拟人手完成各类精细操作,不仅适用于捞面、倒酒等服务场景,更能泛化到工业生产、商业服务、家庭照料等各类“打工”场景中,这正是机器人从“表演工具”走向“生产服务工具”的核心分水岭,也是具身智能商业化真正的想象力所在。
当然,单一的灵巧手并不足以支撑商业化落地,机器人要真正走进真实场景“打工”,背后需要一整套完整的技术体系作为支撑。为此,各大机器人头部厂商给出了各式各样的解决方案。
举例来说,魔法原子的思路是“软硬一体”的全栈技术把控,即贯穿硬件层面的核心关节模组、感知传感器,软件层面的“大脑+小脑”具身智能架构(大脑负责多模态理解与任务决策,小脑负责运动控制与实时执行),以及数据层面的真实场景数据采集、算法模型训练与迭代,这样才能让机器人在不同场景中稳定、高效地完成任务。
所以,无论是跳舞和倒酒,这些技能只是机器人能力的冰山一角。只要背后的技术能持续迭代,机器人早晚能够把所有的活都干一遍。
走进真实场景“赚钱”,是机器人迈向商业化的第一步
如果把机器人的商业化进程比作一次赛跑,具备相关的技术最多只能算站在起跑线上,能到真实场景“赚钱”才算迈出第一步。
而春晚机器人的表演,就是一种“真实场景的考验”。春晚的聚光灯下,机器人的每一个动作都被全球观众注视着,整场表演零失误的完成,本质上是一场面向全球的产品稳定性压力测试。
春晚舞台有着极为严苛的要求:复杂的灯光环境会干扰视觉感知系统,舞台地面的摩擦系数、现场的人流变化都存在不可控因素,直播更是不允许出现任何失误与停顿。像宜宾分会场那100台魔法原子的机器熊猫,但凡群控能力稍有漏洞,节目效果都会大打折扣。