推测
分类
解码」
「推测性推测解码」(SpeculativeSpeculativeDecoding,简称SSD),是一种新型的推测性解码(SD)。
文章
比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」2026年04月01日13:02机器之心Pro在大语言模型推理领域,虽然「推测解码」(SpeculativeDecoding,SD)已成为加速生成的标准配置,但它依然存在一个致命弱点:drafting(草拟)和verification(验证)之间必须串行进行。
文章
解码
总的来说,SSD推动了延迟-吞吐量帕累托前沿的发展,其方式与普通推测解码推进标准自回归算法的发展非常相似。
文章
研究者引入推测性推测解码(SSD),这是一个旨在并行化草拟和验证的统一框架。
文章
之间
识别了预测准确性与生成高质量推测之间的张力,并开发了一种能够平衡二者的采样算法。
文章