推理
分类
能力
从Best-of-N、Self-Consistency到更复杂的搜索与验证框架,Test-TimeScaling已经成为提升大模型复杂推理能力的重要范式。
文章
细节
与此同时,低置信token则可能对应不确定的推理细节、实现方式或局部表达。
文章
系统
从这个角度看,PRISM不只是一个更省算力的Best-of-N替代方案,而是离散扩散语言模型迈向高效推理系统的一块关键拼图。
文章
搜索
传统Best-of-N太贵,PRISM重新设计dLLM的推理搜索
文章
对于自回归模型,推理搜索通常围绕「前缀」展开;
文章