登录

推理


分类

能力

从Best-of-N、Self-Consistency到更复杂的搜索与验证框架,Test-TimeScaling已经成为提升大模型复杂推理能力的重要范式。
文章

细节

与此同时,低置信token则可能对应不确定的推理细节、实现方式或局部表达。
文章

系统

从这个角度看,PRISM不只是一个更省算力的Best-of-N替代方案,而是离散扩散语言模型迈向高效推理系统的一块关键拼图。
文章

搜索

传统Best-of-N太贵,PRISM重新设计dLLM的推理搜索
文章

对于自回归模型,推理搜索通常围绕「前缀」展开;
文章