登录
更多
已读文章
名词
现象
观点
问题
政要
算力消耗
描述
传统AI对话中,一次用户请求对应一次模型推理,消耗的Token通常在几百到几千之间,用户问完即走,
算力消耗
是离散、短周期的。
文章