登录

小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线


速读:在涵盖感知、推理与规划的多个主流基准上,XiaomiOneVL全面刷新潜在推理方法的性能上限:。 过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解场景并输出驾驶动作,世界模型专注于预测未来场景的演变。
2026年05月13日 18:1

快科技5月13日消息,今日,小米正式发布并开源Xiaomi OneVL自动驾驶模型。

该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一, 在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。

其在精度上超越显式CoT、在速度上对齐“仅答案”预测的潜空间CoT方案。

过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解场景并输出驾驶动作,世界模型专注于预测未来场景的演变。

Xiaomi OneVL通过潜空间推理,首次将两者统一到同一套框架中。

在涵盖感知、推理与规划的多个主流基准上,Xiaomi OneVL全面刷新潜在推理方法的性能上限:

在ROADWork、Impromptu、Alpamayo-R1三项基准上均达到SOTA,并在NAVSIM上取得优越性能,PDM-score达到88.84,首次在潜空间推理中超越显式 CoT(88.29);

目前唯一在所有基准上超越显式自回归CoT的隐式推理方法;

挂载MLP回归头变体,延迟进一步压到0.24s(4.16 Hz),仅为VLA自回归推理的5.4%,为量产车端实时部署提供了可行路径。

消融实验进一步验证,压缩物理世界的动态信息能带来显著的性能提升。

同时,Xiaomi OneVL能为模型决策提供语言和视觉双维度的可解释性——既能用文字说明“为什么这样开”,也能用预测画面展示“接下来会发生什么”。

【本文结束】如需转载请务必注明出处:

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?

微信封禁自家“兄弟”红包,打的什么牌?

华住,比携程还会捞金?

名单公布!16位美国商界领袖随特朗普访华:库克、马斯克在内 黄仁勋无缘

男子突发奇想“晒眼睛”:直视太阳10分钟!视力降至0.4

世界杯转播权要价21亿元!FIFA官网没有中文模式惹恼中国网友 日韩印都有

贵州一女子河道放生奶茶边倒边念经 网友吐槽荒唐:当地水务局介入并回应

下月起外卖不贴封签可当场拒收 可通过外卖平台或拨打12315维权

降噪耳机受害者出现:透支听力 损耗大脑听觉、解码能力

华为劲敌来了!安卓第一款阔折叠7月发:三星打造 售价过万

退钱哥自嘲花2.5万买开幕式山顶门票:美加墨世界杯第一大冤种

AI基建狂潮来袭!黄仁勋喊话电工水管工:你们的时代来了

红狼再大战 成都AG超玩会4:3战胜重庆狼队 一诺落泪:压力太大

主题:推理|世界模型