登录

输出

分类

速度

但真正让它在一众模型中脱颖而出的，是289tokens/秒的输出速度：首token延迟大约65毫秒，比其他前沿模型快了4倍左右。

文章

如果模型输出速度是原来的4倍，在Agent调用工具的时间不变的前提下，一天内的产出可能提升2到3倍。

文章

而Gemini3.5Flash65毫秒的首token延迟，289tokens/秒的输出速度，意味着用户几乎感受不到等待。

文章