登录

算力消耗

描述

传统AI对话中，一次用户请求对应一次模型推理，消耗的Token通常在几百到几千之间，用户问完即走，算力消耗是离散、短周期的。

文章