小米自研大模型MiMo-V 2.5系列API永久降价:最高降99%不再区分上下文长度
快科技5月27日消息,今日,小米宣布,旗下MiMo-V2.5系列大模型API迎来永久降价。
据介绍,相比原始API定价, MiMo-V2.5系列新价格最高降幅可达99%,并且不再区分上下文窗口长度。
本次调价已于北京时间5月27日0:00正式生效,全球同步调整。
具体来看,此次降价覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本。
其中, MiMo-V2.5 Pro输入缓存命中价格降至0.025元/百万tokens,最高降幅达99%;MiMo-V2.5输入缓存命中价格降至0.02元/百万tokens,最高降幅达98%。
输出价格方面,MiMo-V2.5 Pro降至6元/百万tokens,最高降幅86%;MiMo-V2.5降至2元/百万tokens,最高降幅93%。
除了API价格下调外,MiMo的Token Plan计费体系也同步迎来重大优化。
优化后的Token Plan在加量不加价的基础上, 用量提升至原来的5至8倍,同时引入Credits概念,让计费规则更清晰、更易理解。
小米称,本次价格调整背后,离不开技术团队在推理系统上的持续优化。
据了解,小米基于SGLang HiCache完整支持SWA(Sliding Window Attention), 将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓存token数量提升至优化前的近5倍, 从而显著提升缓存命中率和推理效率。
同时,小米还通过优化专家并行方案、输入长度分桶策略等方式,进一步提升集群输入吞吐能力,在保障服务质量的前提下,持续降低单位token服务成本。
【本文结束】如需转载请务必注明出处:



新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?
微信封禁自家“兄弟”红包,打的什么牌?
华住,比携程还会捞金?
减肥的女儿被妈妈做的减脂餐震撼到了:画风硬核
杭州湿度90% 网友:出门感觉被牛舔了
华为Mate 90系列顶配版偷跑:史上堆料最疯狂的Mate来了
首发麒麟2026!华为Mate 90系列顶配搭载6.9英寸双层OLED屏
华为韬定律被赞又一DeepSeek时刻:证明没有EUV仍可创新
6.4万 中国市场最贵辅助驾驶系统!特斯拉FSD已在国内灰度推送约5000台车
贾跃亭FF拿下最大订单:一口气卖了23台EAI机器人
蚂蚁集团:Token消耗将迎来指数级增长 预计2030年消耗量增长超300倍
华为成立半导体公司:从自研5G基带、7nm麒麟到韬定律改写全球半导体规则 手握数百项专利
把AI塞进2000块的手机里,OPPO想明白了一件事
59岁!“高考钉子户”梁实准备第30次高考 今年的目标未定心里没底
华为何庭波:“麒麟 2026”手机芯片是逻辑折叠技术的首次成功实施,未来十年会持续走向全面折叠
央视起底陈克明今麦郎商标心机 手擀面的手擀竟是商标
1400万撬动十几亿票房!王晶谈《给阿嬷的情书》:观众不能吃太多哭戏
使用的车主实在太多 !雷军:推荐码月底停用 有点扛不住了
车行老板说油车掉价20万都没人买:还在拼命收油车 被自己气笑了
依法依规!我国停止向日本出口稀土、关键金属:后者芯片、汽车、飞机制造陷被动
四电机马力超千匹 法拉利首款纯电动车Ferrari Luce发布:苹果味十足
消息称阿里、京东、美团三方竞购朴朴超市,估值 20-50 亿美元
以车重为计税依据正探讨!新能源车越来越重 有的重达4吨比轻卡还重:专家痛批
主题:小米