登录
更多
已读文章
名词
现象
观点
问题
政要
英伟达提出
分类
模型
英伟达提出
的模型不使用弱外部MTP模型或额外heads,而是利用自身的扩散模式同时起草多个token,然后在AR模式下使用相同的KVcache验证它们。
文章