上海交大王贺升教授:从画地图到预测未来,传统SLAM正走出静态世界
上海交大王贺升教授:从画地图到预测未来,传统 SLAM 正走出静态世界 | ICRA 2026
2026年06月03日 16:4
雷峰网 (公众号:雷峰网) 讯 2026 年 6 月 1 日,国际机器人与自动化会议(ICRA)在奥地利维也纳召开。次日上午的自动驾驶与导航报告环节,雷 峰网GAIR 2021大会嘉宾、 上海交通大学教授王贺升发表了题为《Learning to Navigate: From Scene Un derstanding to Decision Makin》的演讲。
找到自己的位置,并理解周围环境,一直是机器人能够落地的先决条件。此前的导航系统大多建立在”环境静止、结构稳定”的假设之上,但随着具身智能从实验室走向真实场景,现实世界的动态变化让传统 SLAM(同步定位与建图)逐渐迫近天花板,无力应对自动驾驶中的车辆行人,或是手术机器人面前多变的人体组织。运动、遮挡甚至形变问题,是新一代 SLAM 需要解决的全新问题。
围绕这一挑战,王贺升教授系统介绍了从感知、建图、定位到规划的完整技术路线。在感知层面,研究团队提出结合激光雷达与视觉传感器进行多模态融合,并通过光流、场景流和四维重建技术理解动态环境的方案,在建图层面,则提出通过动态 Gaussian SLAM 和可变形三维高斯地图,实现对运动目标和可变形环境的持续建模。王贺升教授特别提到,“人体这种非常可变形的环境”是当前研究主要的对象,以期解决手术机器人场景中的定位与建图难题。
此外,针对具身智能普遍缺乏长期记忆和环境理解能力的问题,团队还尝试引入 NeRF 记忆机制以及视觉语言模型推理能力,让机器人不仅知道“自己在哪里”,还能利用历史经验和语义关系辅助导航决策。
据王贺升教授介绍,相关技术已在矿卡、仓储机器人、自动泊车、移动通信平台和割草机器人等场景中落地应用。可以看到,面对真实世界中的动态变化、复杂语义和环境形变等挑战,机器人导航正从传统 SLAM 走向融合世界模型、大模型推理与可变形环境感知的具身智能基础设施。
以下是王贺升在 ICRA 2026 大会发表的演讲精编稿,AI 科技评论基于原英文演讲内容进行了不改原意的翻译编辑:
《Learning to Navigate: From Scene Understanding to Decision Makin》
主讲人:王贺升(Hesheng Wang),上海交通大学