大模型的任务

描述

这其实与Anthropic开发ClaudeCode的底层思考一致，也就是《苦涩的教训的边界》中所提到的：很多确定性的事情，比如比较9.11和9.2的大小，就应该交给代码去执行，大模型的任务是判断何时调用代码并提取结果，而不是把冗长的上下文塞进提示词里让模型自己去瞎猜，那样极不稳定。

文章