登录

大模型的任务


描述

这其实与Anthropic开发ClaudeCode的底层思考一致,也就是《苦涩的教训的边界》中所提到的:很多确定性的事情,比如比较9.11和9.2的大小,就应该交给代码去执行,大模型的任务是判断何时调用代码并提取结果,而不是把冗长的上下文塞进提示词里让模型自己去瞎猜,那样极不稳定。
文章