推理
描述
推理和行动,是两种用来降低同一种不确定性(epistemicuncertainty,认知不确定性)的工具。
文章
分类
能力
如果Agent系统性地把本可以内部解决的任务也外包出去,它的内部推理能力不会因为经验积累而变强,哪怕它在原理上本可以变强。
文章
模型(Model):提供参数里的知识、内部推理能力——也就是Qint的基础。
文章
AgentA什么都默认靠外部工具,内部推理能力被绕开、无法巩固;
文章
AgentB在内部能解决时就内部解决——但并不排斥在真正需要时使用工具——推理能力在练习中被强化。
文章
模型
ICML2026提出的TheoryofAgent(ToA)——以及它如何解释当下最前沿的长上下文、推理模型、工具使用、自进化智能体背后那根共同的主线。
文章
这解释了为什么推理模型(o1/R1那一代)把赌注押在「内部scaling」上——在它们的成本结构下,多推几步比调一次工具便宜得多。
文章
效果
学会「在给定上下文下,下一个该用哪个工具」,就不只是「会推理」,而是会决定如何降低不确定性。
文章
推理和行动,是两种用来降低同一种不确定性(epistemicuncertainty,认知不确定性)的工具。
文章
这些现象通常被分别归类为reasoning、planning或tool-use的问题,因此业界也习惯于逐个修补:过度推理就增加长度惩罚,工具滥用就约束actionbudget,行动不足就强化工具调用能力。
文章