对话星动纪元创始人陈建宇：具身智能加速进入物理世界

速读：但更关键的是，这些能力并没有经过提前专项建模，基于独创的原生机器人大模型和为AI定义的全新硬件平台，星动STAR1开始像人一样感知世界，然后学习、然后预测、然后反馈、然后进阶。陈建宇是原生AI的设计。博士毕业后回到清华姚班任教，带领团队继续深入研究具身智能与人形机器人技术，并于去年创立了星动纪元。

对话星动纪元创始人陈建宇：具身智能加速进入物理世界 | 元璟科技十人谈

2024年10月17日 09:33

星动纪元的第六代人形机器人“星动STAR1”刚刚结束了河西走廊之旅，在古老的山地、草地、戈壁和现代的公路地形中，它腾空奔跑，快速运动。这也不是我们第一次见识星动STAR1的全能，在日常的测试中，它取物倒水、修剪花草，甚至遛狗和抚摸小猫……

但更关键的是，这些能力并没有经过提前专项建模，基于独创的原生机器人大模型和为AI定义的全新硬件平台，星动STAR1开始像人一样感知世界，然后学习、然后预测、然后反馈、然后进阶。

近日， STAR1 背后的「星动纪元」公司也完成了再一次进阶，公司宣布完成近 3 亿元 Pre-A 融资，致力于成为原生通用具身智能体的定义者。作为本轮投资的联合领投方，元璟也持续将人工智能和智能机器人作为主攻方向，在最近的一场对话活动中，元璟科技团队和星动纪元创始人陈建宇展开讨论。在 AI 的驱动下，具身智能对真实物理世界的影响，可能比我们想象的还要来得更快。

（人形机器人星动STAR1行进在河西走廊）

星动纪元的人形机器人为我们展现出真正由AI驱动的具身智能体。

它足够 AI 原生，机器人像人一样进行学习，摈弃掉任何人类先验，几乎没有人工编程，致力于用最本质和简洁的算法去让AI学到最多的知识；

它足够通用，不针对每一个单一任务设计软硬件，机器人可以学会各种任务，适应各种环境；

它的本体也围绕AI去设计，高度拟人，去看见、去触摸，机器人用人类与世界最原始的交互的方式来认识世界、获取数据。

在今年秋季举行的元璟资本投资人年会上，元璟资本执行董事任易与星动纪元创始人陈建宇展开对话， “我们正在努力去实现的，是做出一款‘原生’的机器人大模型。它并不仅仅是大语言模型的有限拓展，而是真正在丰富多彩的物理世界数据基础上训练，真正去理解和改造我们这个物理世界，”陈建宇说。

以下为对话内容

Q：元璟资本任易 A：陈建宇

具身智能：构建通用的

和这个世界交互的AI

任易：非常感谢陈老师跟我们做人形机器人的讨论，在过去一年，具身智能和机器人在学术界和产业界都受到了非常大的关注。首先请陈老师介绍一下自己。

陈建宇：非常感谢元璟的邀请，大家好，我是星动纪元的创始人陈建宇，也是清华姚班的助理教授。我十多年来一直从事机器人和AI的研究工作，并横跨具身智能算法到传统机器人学再到机器人硬件。我本科时在清华搞机器人硬件并参加比赛，本科毕设研究双足机器人的步态规划算法。后来我直博去了UC Berkeley，研究机器人控制以及机器学习算法。如果区分一下，本科主要是学习硬件和传统控制，到博士期间经历了机器人从传统控制到AI主导的变化过程；博士毕业后回到清华姚班任教，带领团队继续深入研究具身智能与人形机器人技术，并于去年创立了星动纪元。我们召集了全国范围内非常顶尖的研究人员和工程技术团队，在一年时间内快速迭代了很多代机器人，现在已经迭代到了第六代，今年也在开始加速商业化的探索。

任易：机器人本身不是一个新的主题，第一台人形机器人1986年就存在，那为什么现在机器人又会变成一个大家很关注的一个主题？它最大的变化是什么？

陈建宇：最大的变化就是 AI，而且是原生的AI。机器人本身有很长的历史了，包括我们现在规模化应用工在厂里面的工业机器人，其实也有半个多世纪的历史了。

什么是原生的AI呢，就是没有人类先验，完全由AI驱动。 AI有个著名的概念the bitter lesson，由“强化学习之父”理查德·萨顿提出，讲的就是没有人类先验，简洁的AI算法+大规模最终总会有更好的效果，我们在机器人领域看到的变化也是一样，从之前基于编程的，基于物理世界建模的方法，演变为基于原生AI的数据驱动方法。

传统的机器人算法需要做比较细致的编程，这样才能让机器人做相应的事情，但是这会造成有一些难以建模的复杂动作无法完成，而且大量的编程会耗费大量人力物力。今天世界上的机器人数量还是非常少的，最主要的原因是缺乏比较通用的智能，以致于机器人只能做简单单一的工作。

而现在，一方面AI的技术开始往机器人里面去渗透，另一方面大语言模型的出现，也体现出AI的范式也在经过大规模的变化：更简洁的算法、更少的先验知识，同时配合规模更大的计算，实现更加复杂的性能，甚至智能的涌现。

任易：这就是大家说的更多的具身智能？

陈建宇：是的，往更大的地方说，我们今天希望去让AI学会一个通用的和这个物理世界交互的方式，而不仅仅局限于大语言模型那样学习人的语言和知识表达。这样的AI是更难的，因为它需要对整个物理世界最原始的数据来做学习。同时，它不仅仅需要软件，还需要硬件载体，这就是为什么我们也做机器人本体。

“通用具身智能体，

意味着原生机器人大模型

和面向AI的硬件载体”

任易：在这样的大技术变革下，其实是非常‘非共识’的，大家眼里看到的未来都不同，您眼中AI的技术变化会给机器人带来的未来是什么？您今天扎进产业里来创业的目标是什么？

陈建宇：我们的目标是打造一款通用具身智能体。首先就像刚才我们提到的，是对现实物理世界交互知识的建模和学习。我们最终需要的，也是我们正在努力去实现的，是做出一款“原生”的机器人大模型。它并不仅仅是大语言模型的有限拓展，而是真正在大规模的丰富多彩的物理世界数据基础上训练，真正理解我们这个物理世界，并知道怎样控制机器人的身体去改造这个物理世界，实现我们制定的目标。

同时，我们这里要强调智能体的体，是因为学会和世界互动一定需要载体，所以我们一定要构建硬件，而且硬件必须也是围绕AI来构建的，一切为了AI服务。在形态上我们直接选择了最终极的人形，因为人形是最通用的形态，也是通用具身智能体的最佳载体。因为人类是这个世界上通用具身智能体的唯一现存实例，也只有人类能提供足够多的与这个世界交互的各类丰富的数据供模型进行学习。而人形机器人作为机器人领域皇冠上的明珠，其相应的操作、移动等功能都能向下兼容到其他形态，比如机械臂和轮式。

“如何实现具身智能？

简洁、通用、端到端和全模态”

任易：但今天具身的技术实现还完全没有收敛，model VS learning, RL和模仿学习，小模型VS大模型，包括无论是算法还是数据等等，您选择的技术路线是什么？

陈建宇：我们的技术路线最重要的特点，是原生AI的设计，摈弃掉任何人类先验，我们的机器人里几乎没有人工编程，我们致力于用最本质和简洁的算法去让AI学到最多的知识。也是得益于原生AI的设计，我们在做一个非常通用的学习方式，设计一个通用的方法去学习所有的交互的方式，它和任务无关，和环境无关，甚至和机器人形态也无关。因此我们能够通用地去解决各类机器人移动和操作问题。最后在这样简洁而原生的AI架构下，我们在模型和数据上做规模化，做scaling。简洁并不等于简单，更简洁但更好的架构其实是更难设计的。

任易：那首先是通用，大家都在说通用，您如何理解通用？

陈建宇：我们希望机器人能够通用的适应各种环境，执行各种任务。会从基于人类知识和先验的建模中解放出来，获得通用的智能；当机器人具备足够的泛化性时，我们就不用针对每一个单一任务单独设计机器人的软硬件了，机器人的应用也将随之迎来阶跃式的发展。

想象我们需要快速部署机器人到工厂里去执行一道新的工序。尽管机器人以前从没有见过这道工序，它也能直接上手执行并达到80分的水平，因为它在海量的数据中训练，具备了物理常识和推理能力，能够对新的任务进行理解和泛化。为了进一步提升，我们可以请人演示一遍这道工序的操作过程。模型看过这个演示后，在对任务的基本理解基础上通过模仿从而达到了90分的水平。接下来，模型不断地自我强化训练执行这道工序，经过比如一个下午的练习后，最终达到接近100分的水平。这种模式我们希望能通用地适用于任何任务，任何环境。

要实现这样的通用效果，就要求我们一定尽可能地去除人类先验，设计一个简洁而恰当的原生AI架构去做scaling。我们的AI系统架构很简洁，无论移动还是操作都是端到端的，从输入到输出都是一个网络，感知输入动作输出，整个学习是无损的。在这样简洁的端到端架构下，我们通过算法、数据和网络架构的迭代和积累不断提高机器人各方面能力的通用性。

任易：端到端确实是个趋势，我们也选择all in端到端？

陈建宇：对，我们一个很大的特点就是端到端。从感知到预测到规划到控制，整个链条很长，如果用传统的方法，在链条之间加入人为设计的中间界面，这会产生信息的损失，同时数据也是分散的，没法共享。所以我们非常重视端到端，用一个神经网络解决所有环节的问题，从感知的输入直接到动作的输出。建立这样的范式之后，我们再想办法去规模化。这样端到端的方式可以适配所有可能的任务和环境，因为它是用最原始的跟这个世界交互的输入和输出，也不需要任何针对特定任务的中间过程编程。

主题：机器人|星动纪元|具身智能|陈建宇|星动STAR1