登录

推理

分类

能力

从Best-of-N、Self-Consistency到更复杂的搜索与验证框架，Test-TimeScaling已经成为提升大模型复杂推理能力的重要范式。

文章

细节

与此同时，低置信token则可能对应不确定的推理细节、实现方式或局部表达。

文章

系统

从这个角度看，PRISM不只是一个更省算力的Best-of-N替代方案，而是离散扩散语言模型迈向高效推理系统的一块关键拼图。

文章

搜索

传统Best-of-N太贵，PRISM重新设计dLLM的推理搜索

文章

对于自回归模型，推理搜索通常围绕「前缀」展开；

文章