登录

算力消耗


描述

传统AI对话中,一次用户请求对应一次模型推理,消耗的Token通常在几百到几千之间,用户问完即走,算力消耗是离散、短周期的。
文章