登录

输出


分类

速度

但真正让它在一众模型中脱颖而出的,是289tokens/秒的输出速度:首token延迟大约65毫秒,比其他前沿模型快了4倍左右。
文章

如果模型输出速度是原来的4倍,在Agent调用工具的时间不变的前提下,一天内的产出可能提升2到3倍。
文章

而Gemini3.5Flash65毫秒的首token延迟,289tokens/秒的输出速度,意味着用户几乎感受不到等待。
文章