登录

DeepSeek V 4发布前,罗福莉亮剑!小米最强大模型MiMo


速读:基于小米MiMo团队开发的评估套件MiMoCodingBench,MiMo-V2.5-Pro与ClaudeOpus4.6的差距进一步缩小,得分分别为73.7分和77.1分,MiMo-V2-Pro是71.5分。 今年3月,小米MiMo-V2-Pro曾以匿名模型Hunter Alpha的身份现身OpenRouter平台,一度被开发者误认为是即将发布的DeepSeek V4。 小米官方称,MiMo-V2.5-Pro是小米MiMo迄今最强大模型,在通用智能体能力、复杂软件工程以及长程任务等维度上,能与ClaudeOpus4.6、GPT-5.4等全球顶尖Agent模型相当,相较上一代模型MiMo-V2-Pro提升。
DeepSeek V4发布前,罗福莉亮剑!小米最强大模型MiMo-V2.5深夜突袭

DeepSeek V4发布前,罗福莉亮剑!小米最强大模型MiMo-V2.5深夜突袭

2026年04月23日 06:00

智东西

小米大模型 时隔一月能力飙涨, 比Kimi K2.6省42% Token。

作者 |   程茜

编辑 |   李水青

智东西4月23日报道,刚刚,小米MiMo大模型一口气官宣4款新模型: 旗舰推理模型 MiMo-V2.5、 全模态Agent模型 V2.5-Pro开启公测、即将开源 ;V2.5-TTS Series、V2.5-ASR即将推出。

小米MiMo 大模型负责人正是 原 DeepSeek核心成员、被业内称为“天才少女”的罗福莉 , 这距离上次MiMo-V2系列重磅三连更仅36天。上一代模型发布时,罗福莉曾发文称“ 未来模型足够稳定后,他们将开源 ”。

与上一代模型类似, MiMo-V2.5全系列同样是 为智能体场景打造 ,MiMo-V2.5-Pro专为长难Agent任务打造,MiMo-V2.5可覆盖绝大多数通用Agent场景。

小米还贴心为用户提供了官方使用指南:MiMo-V2.5支持原生全模态Agent能力,涵盖图像、音频与视频,相比Pro版模型平均推理速度更快,更适应对时延敏感的任务。

除性能外,此次小米MiMo新模型还有一大升级点是 更高的Token效率 。根据官方信息,在拿到智能体基准榜单ClawEval相同分数的情况下:

MiMo-V2.5-Pro相比Kimi本周发布的开源旗舰多模态智能体模型Kimi K2.6节省了 42% Token ;MiMo-V2.5相比Meta本月初发布的闭源多模态推理模型Muse Spark节省了 50% Token 。

此外,小米还全面升级了模型订阅计划Token Plan: 取消4倍的Credits计费方式、计费不区分256k和1M上下文、夜间享有专属优惠速率、新增自动续费模式 。值得一提的是,其Token Plan计划刚发布时,就有不少用户吐槽价格太贵,便宜的套餐Token不够用。

智东西体验了 MiMo-V2.5-Pro,让其“ 制作一个3D横版格斗游戏”, MiMo-V2.5-Pro在几分钟内、写了1123行代码,就生成了“龙虎格斗游戏”。该游戏界面的血条、双方角色名、倒计时、对战提示清晰,还包含命中火花、格挡碎片、镜头震动+命中停顿等反馈系统,具备一定可玩性,但人物角色造型简单,除颜色和帽子几乎没差异。

▲龙虎格斗游戏界面 ▲龙虎格斗游戏界面 有意思的是,今年3月,小米MiMo-V2-Pro曾以匿名模型Hunter Alpha的身份现身OpenRouter平台,一度被开发者误认为是即将发布的DeepSeek V4。如今小米新一代MiMo-V2.5推出,又正值DeepSeek V4被传出将于本周发布。

Xiaomi MiMo开放平台:

https://platform.xiaomimimo.com

Xiaomi MiMo Studio体验地址:

https://aistudio.xiaomimimo.com/#/c

01 .

MiMo-V2.5-Pro:专攻长难智能体任务

4.3小时搞定本科生数周项目

小米官方称, MiMo-V2.5-Pro是小米MiMo迄今最强大模型 ,在通用智能体能力、复杂软件工程以及长程任务等维度上,能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型相当,相较上一代模型MiMo-V2-Pro提升。

根据小米内部测试,搭配合适的运行框架,MiMo-V2.5-Pro可以稳定完成单次涉及 近千轮工具调用 的长程任务。且在智能体场景下,该模型指令遵循能力提升,其既能捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。

基于小米MiMo团队开发的评估套件MiMo Coding Bench,MiMo-V2.5-Pro与Claude Opus 4.6的差距进一步缩小,得分分别为73.7分和77.1分,MiMo-V2-Pro是71.5分。

有推特网友用此前的网红问题实测了MiMo-V2.5-Pro,其问题是“我想去洗车,洗车店离我50米远,我应该走着去还是开车去”,MiMo-V2.5-Pro不负众望,给出了正确答案。

小米MiMo放出了几个MiMo-V2.5-Pro的实操案例。

首先是“用Rust实现完整的SysY编译器”。 这一任务的难点在于,模型需独立完成词法分析器、语法分析器、AST、Koopa IR代码生成、RISC-V汇编后端,以及性能优化。

在实际操作中,该模型采用逐层搭建整个编译器的方式,其先搭完整流水线骨架再逐层攻克。在各项的具体分数中,模型在Koopa IR、RISC-V后端、性能优化上都拿到了满分,首次编译实现了59%的冷启动通过率,这意味着在跑任何测试之前,架构是对的。在第512轮,该模型一次重构令lv9/riscv回退了两个测试点;模型自行诊断、恢复、继续推进。

这一任务是北京大学《编译原理》课程项目,北大本科生通常需要数周时间才能完成,MiMo-V2.5-Pro用时 4.3小时 、经过 672次 工具调用完成,在隐藏测试集上取得满分233分。

第二个官方案例是开发视频编辑器 ,其提示词为“构建一个视频编辑器Web应用”。MiMo-V2.5-Pro交付的Web应用具备多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等功能。其最终构建的代码量达 8192行 、历经 1868次 工具调用,在 11.5小时 的自主工作中完成。

第三个案例是模拟电路EDA任务 ,其需求是“基于台积电180nm CMOS工艺,从零开始设计并优化一款完整的翻转电压跟随器低压差线性稳压器(FVF-LDO)”。

完成任务期间,该模型需要确定功率晶体管尺寸、调整补偿网络并选择合适偏置电压,以使相位裕度、线路调整率、负载调整率、静态电流、电源抑制比和瞬态响应六个指标同时符合规格。

经验丰富的模拟电路设计师通常需要花费数天时间才能完成此类项目。研究人员将MiMo-V2.5-Pro连接到ngspice仿真循环中,并使用Claude Code作为仿真框架,经过大约一个小时的闭环迭代,其就生成了一个满足所有目标指标的设计,并且下面显示的四个指标比其初始版本提高了一个数量级:

02 .

MiMo-V2.5:能听能看能读

负责通用智能体场景

MiMo-V2.5 是专为智能体场景打造的原生全模态模型,能通过同时看、听、读,并根据感知到的信息采取行动。

该模型此次有两个关键升级点: Agent能力 全面超越 MiMo- V2-Pro、 多模态感知 全面超越MiMo-V2-Omni,MiMo-V2-Pro是小米MiMo系列上一代旗舰基座大模型、MiMo-V2-Omni是上一代全模态Agent模型。

其中,在面向AI智能体的端到端可信评测基准Claw-Eval中,MiMo-V2.5表现超过MiMo-V2-Pro,同时API成本降低约 50% ;在关于跨模态推理、视频理解、图表分析等的基准测试VideoMME、CharXiv、MMMU-Pro等评测中,MiMo-V2.5表现逼近甚至超越了Claude Opus 4.6、Gemini 3 Pro、GPT-5.4等闭源模型。

在编程方面,小米内部的MiMo编程基准测试显示,MiMo-V2.5在日常编程任务中超越了Gemini 3.1 Pro,与Claude Opus 4.6仍有明显差距。

03 .

Token Plan:夜间专属时段8倍优惠

包年订阅可减近1000元

伴随MiMo-V2.5系列发布,小米还同步优化了其订阅式API调用套餐MiMo Token Plan,该计划允许用户使用 MiMo系列8款模型 ,分别是旗舰推理模型MiMo-V2-Pro、MiMo-V2.5-Pro,全能多模态模型MiMo-V2-Omni、MiMo-V2.5,语音合成模型MiMo-V2-TTS、MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign,后三个模型待发布。

首先是 Credits速率更新、更优惠 ,取消1 Token=4 Credits计费方式,且不再区分256k和1M上下文窗口的Credit倍率。

新模型的Credits计费方式为:

MiMo-V2.5:1x(消耗1 Token=1 Credit)

MiMo-V2.5-Pro:2x(消耗1 Token=2 Credits)

作为对比,MiMo Token Plan刚发布时的计费方式为:

此外,MiMo Token Plan还会提供 夜间专属优惠速率 ,每天00:00~08:00,所有模型Credits消耗速率在原有基础上再打8折。

在付费模式上,其此前预告的 连续包月、包年订阅 也已上线。连续包月中,老用户开通自动续费享次月7折,新用户享次月77折,包年订阅中,一次订阅享全年88折,包年至高可减948.96元。

截至北京时间4月22日22:00前,所有已购买Token Plan用户Credits额度将全部重置清零,但不重置套餐计时。

04 .

结语:小米再发力

跑通终端系统级原生智能体?

小米MiMo V2.5系列的升级围绕着智能体场景性能提升及更高Token效率两大关键,其在保障长链推理、工具调用、多任务协同等核心智能体性能的同时,大幅提升Token使用效率,降低算力与推理成本,或证明轻量化模型既能实现媲美超大模型的智能体表现,又能兼顾实用与普惠。

此次,小米MiMo旗舰模型再升级,也意味着其作为终端硬件厂商,正将自研底层大模型、系统级权限、全生态服务进行深度绑定与融合,打造真正意义上的系统级原生智能体,加速其人车家全场景AI的规模化落地。

海量资讯、精准解读,尽在

小米 智能体

新浪财经公众号

新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

01 / 买的汽车品牌快经营不下去了,车主该怎么维权保住自己的权益

02 / 成都瑞迪智驱科技股份有限公司2025年年度报告摘要

03 / 乖宝宠物食品集团股份有限公司2025年年度报告摘要

04 / 21社论丨坚持创新导向,增强资本市场价值发现功能

05 / 隆华科技集团(洛阳)股份有限公司2025年年度报告摘要

06 / 全民阅读活动火热 阅读产业有望迈上新台阶

07 / 外卖点了100克肉到手只有30克,缺斤少两该怎么维权

08 / 青年发展型城市建设,重在具体化丨冯奎专栏

09 / 兴业沪港深成长先锋混合型发起式证券投资基金基金合同生效公告

10 / 中国载人航天工程 首批外籍航天员来了

01 / 午盘:美股继续走高 纳指上涨1.2%

02 / 美参议员格雷厄姆:上午与特朗普通话 海峡封锁可能很快演变为全球性

03 / 伊朗扣押集装箱船、美国维持海上封锁,布伦特原油涨破100美元

04 / 能定位会判断 AI乒乓机器人击败人类高手

05 / 美伊无限期停火或许也是无限期的不确定性 市场学习如何与之共处

06 / 美联新材十大流通股东格局生变:勒艳青退出,勒伍超等减持

07 / 冰淇淋界“地震”:被联合利华“驱逐”的CEO转投Jeni's,Ben & Jerry's陷生存危机

08 / 4月22日增减持汇总:晨化股份等8股拟减持,暂无A股增持(表)

09 / 特朗普延长停火后 美伊在霍尔木兹上演“边缘博弈”

10 / 消息人士:特朗普尚未设定伊朗停火延期时间表

01 / 刚买就亏,银行理财不香了?年内超40只产品发行失败,有固收理财近1月年化回报低至-10%

02 / 从债转股到投硬科技,AIC加紧“招兵买马”

03 / 银行理财资金入市步伐持续加快,深交所打新报价一个半月激增87%,定增、基石协同发力

04 / 策略迭代、产品革新 银行理财适配差异化需求

05 / 银行理财平均年化收益率已不足2%?

06 / 法院干警妻子低价拍得6000万银行债权,是否“清白”不能依赖自证

07 / 银行发射卫星的“经济账”

08 / 八大银行鏖战银保2025:走出“降费”阴影,平安银行代销保险收入大涨53.3%

09 / 收益率连跌两月,银行理财规模一季度环比季节性回落

10 / 隔夜逼近1.2%、资金利率持续倒挂,超宽松还能持续多久?

7X24小时

徐小明 凯恩斯 占豪 花荣 金鼎 wu2198 丁大卫 易宪容 叶荣添 沙黾农 冯矿伟 趋势之友 空空道人 股市风云 股海光头

杨伟民

提振服务消费的实现路径

付一夫 :

“服务业扩能提质”背后深意

莫开伟 :

信用卡业务告别跑马圈地模式

任泽平 :

从2025年统计数据看中国未来

CFTC持仓

主题:模型|小米|MiMo-V2.5|罗福莉亮剑|MiMo-V2.5-Pro