登录

解码器


分类

解码器

GuidedVLA延续已有VLA框架,并在动作解码器中指定部分注意力头,让它们分别关注三类任务相关因素:目标、步骤和空间。
文章

GuidedVLA给出的启发是:把任务中真正关键的因素显式纳入训练和结构设计,可以减少动作解码器对隐式学习的单一依赖。
文章

但它也带来一个现实问题:动作解码器往往需要自己从数据中学习哪些因素真正影响任务成功。
文章

直观来说,新分支在训练初期不会直接扰动原模型,随着训练推进,再逐步把目标、步骤、空间等任务相关信息注入动作解码器
文章