登录

小米自研大模型MiMo-V 2.5系列API永久降价:最高降99%不再区分上下文长度


速读:快科技5月27日消息,今日,小米宣布。
2026年05月27日 06:4

快科技5月27日消息,今日,小米宣布,旗下MiMo-V2.5系列大模型API迎来永久降价。

据介绍,相比原始API定价, MiMo-V2.5系列新价格最高降幅可达99%,并且不再区分上下文窗口长度。

本次调价已于北京时间5月27日0:00正式生效,全球同步调整。

具体来看,此次降价覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本。

其中, MiMo-V2.5 Pro输入缓存命中价格降至0.025元/百万tokens,最高降幅达99%;MiMo-V2.5输入缓存命中价格降至0.02元/百万tokens,最高降幅达98%。

输出价格方面,MiMo-V2.5 Pro降至6元/百万tokens,最高降幅86%;MiMo-V2.5降至2元/百万tokens,最高降幅93%。

除了API价格下调外,MiMo的Token Plan计费体系也同步迎来重大优化。

优化后的Token Plan在加量不加价的基础上, 用量提升至原来的5至8倍,同时引入Credits概念,让计费规则更清晰、更易理解。

小米称,本次价格调整背后,离不开技术团队在推理系统上的持续优化。

据了解,小米基于SGLang HiCache完整支持SWA(Sliding Window Attention), 将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓存token数量提升至优化前的近5倍, 从而显著提升缓存命中率和推理效率。

同时,小米还通过优化专家并行方案、输入长度分桶策略等方式,进一步提升集群输入吞吐能力,在保障服务质量的前提下,持续降低单位token服务成本。

【本文结束】如需转载请务必注明出处:

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?

微信封禁自家“兄弟”红包,打的什么牌?

华住,比携程还会捞金?

减肥的女儿被妈妈做的减脂餐震撼到了:画风硬核

杭州湿度90% 网友:出门感觉被牛舔了

华为Mate 90系列顶配版偷跑:史上堆料最疯狂的Mate来了

首发麒麟2026!华为Mate 90系列顶配搭载6.9英寸双层OLED屏

华为韬定律被赞又一DeepSeek时刻:证明没有EUV仍可创新

6.4万 中国市场最贵辅助驾驶系统!特斯拉FSD已在国内灰度推送约5000台车

贾跃亭FF拿下最大订单:一口气卖了23台EAI机器人

蚂蚁集团:Token消耗将迎来指数级增长 预计2030年消耗量增长超300倍

华为成立半导体公司:从自研5G基带、7nm麒麟到韬定律改写全球半导体规则 手握数百项专利

把AI塞进2000块的手机里,OPPO想明白了一件事

59岁!“高考钉子户”梁实准备第30次高考 今年的目标未定心里没底

华为何庭波:“麒麟 2026”手机芯片是逻辑折叠技术的首次成功实施,未来十年会持续走向全面折叠

央视起底陈克明今麦郎商标心机 手擀面的手擀竟是商标

1400万撬动十几亿票房!王晶谈《给阿嬷的情书》:观众不能吃太多哭戏

使用的车主实在太多 !雷军:推荐码月底停用 有点扛不住了

车行老板说油车掉价20万都没人买:还在拼命收油车 被自己气笑了

依法依规!我国停止向日本出口稀土、关键金属:后者芯片、汽车、飞机制造陷被动

四电机马力超千匹 法拉利首款纯电动车Ferrari Luce发布:苹果味十足

消息称阿里、京东、美团三方竞购朴朴超市,估值 20-50 亿美元

以车重为计税依据正探讨!新能源车越来越重 有的重达4吨比轻卡还重:专家痛批

主题:小米