登录

解码器

分类

解码器

GuidedVLA延续已有VLA框架，并在动作解码器中指定部分注意力头，让它们分别关注三类任务相关因素：目标、步骤和空间。

文章

GuidedVLA给出的启发是：把任务中真正关键的因素显式纳入训练和结构设计，可以减少动作解码器对隐式学习的单一依赖。

文章

但它也带来一个现实问题：动作解码器往往需要自己从数据中学习哪些因素真正影响任务成功。

文章

直观来说，新分支在训练初期不会直接扰动原模型，随着训练推进，再逐步把目标、步骤、空间等任务相关信息注入动作解码器。

文章