登录
更多
已读文章
名词
现象
观点
问题
政要
输出
分类
速度
但真正让它在一众模型中脱颖而出的,是289tokens/秒的
输出
速度:首token延迟大约65毫秒,比其他前沿模型快了4倍左右。
文章
如果模型
输出
速度是原来的4倍,在Agent调用工具的时间不变的前提下,一天内的产出可能提升2到3倍。
文章
而Gemini3.5Flash65毫秒的首token延迟,289tokens/秒的
输出
速度,意味着用户几乎感受不到等待。
文章