推理

推理和行动，是两种用来降低同一种不确定性(epistemicuncertainty,认知不确定性)的工具。

文章

如果Agent系统性地把本可以内部解决的任务也外包出去，它的内部推理能力不会因为经验积累而变强，哪怕它在原理上本可以变强。

文章

模型(Model)：提供参数里的知识、内部推理能力——也就是Qint的基础。

文章

AgentA什么都默认靠外部工具，内部推理能力被绕开、无法巩固；

文章

AgentB在内部能解决时就内部解决——但并不排斥在真正需要时使用工具——推理能力在练习中被强化。

文章

ICML2026提出的TheoryofAgent(ToA)——以及它如何解释当下最前沿的长上下文、推理模型、工具使用、自进化智能体背后那根共同的主线。

文章

这解释了为什么推理模型(o1/R1那一代)把赌注押在「内部scaling」上——在它们的成本结构下，多推几步比调一次工具便宜得多。

文章

学会「在给定上下文下，下一个该用哪个工具」,就不只是「会推理」,而是会决定如何降低不确定性。

文章

推理和行动，是两种用来降低同一种不确定性(epistemicuncertainty,认知不确定性)的工具。

文章

这些现象通常被分别归类为reasoning、planning或tool-use的问题，因此业界也习惯于逐个修补：过度推理就增加长度惩罚，工具滥用就约束actionbudget，行动不足就强化工具调用能力。

文章