登录

英伟达提出


分类

模型

英伟达提出的模型不使用弱外部MTP模型或额外heads,而是利用自身的扩散模式同时起草多个token,然后在AR模式下使用相同的KVcache验证它们。
文章