摩尔、沐曦火速适配!MiniMax大动作
摩尔、沐曦火速适配!MiniMax大动作
2026年04月13日 11:34
4月12日晚,MiniMax宣布模型M2.7在全球正式开源。
华为升腾 、摩尔线程、沐曦股份、昆仑芯、NVIDIA,以及TogetherAI、Fireworks、Ollama等海内外芯片厂商、推理平台已完成Day0适配,即在开源首日已经完成模型接入与推理适配工作。
MiniMax透露,目前来自海内外的开发者与企业客户的接入需求在持续增长,模型调用量在快速提升。
多家芯片厂商完成Day0适配
根据官方介绍,MiniMax M2.7于三周前上线,是业界第一个AI深度参与迭代自己的模型。M2.7能够自行构建复杂Agent Harness,并基于Agent Teams、复杂Skills、Tool Searchtool等能力,完成高度复杂的生产力任务。
开源首日,已在A股上市的国产GPU龙头摩尔线程、沐曦股份于当晚宣布,已完成对MiniMax M2.7的Day0适配。
在软件工程领域,M2.7支持端到端完整项目交付、日志分析排障、代码安全审查及机器学习任务。在专业办公场景,其Excel/PPT/Word高保真编辑与多轮修改能力显著提升,即使在超长上下文复杂任务中仍保持稳定的高水平skills遵循率。
这也意味着,该模型对长上下文处理、复杂Agent任务调度及高保真编辑等场景提出了极高的计算效率要求。
针对上述技术挑战,摩尔线程技术团队基于MUSA架构完成深度调优,成功在MTT S5000上实现M2.7大模型的高性能推理,核心技术优势包括超长上下文高吞吐、全精度端到端支持、高算力低延迟推理、强大生态兼容性等。
沐曦股份介绍,曦云C系列GPU已完成对M2.7的Day0深度适配,将为M2.7提供算力支持。依托沐曦股份“自研GPU硬件+MXMACA全栈软件”的软硬一体核心优势,公司得以快速响应大模型迭代节奏,高效完成各类主流模型的适配工作。
此外, 华为升腾 AI基础软硬件实现首日适配,基于vllm-Ascend推理引擎在Atlas800A3、Atlas800IA2系列产品上为模型的推理部署提供全流程支持。
昆仑芯依托自研架构,通过底层算子优化与软硬件协同加速,保障M2.7在平台上的稳定、高效运行表现。
NVIDIA推理框架TensorRT-LLM为M2.7提供了深度适配与全面优化支持,帮助开发者和企业用户高效完成模型的部署与上线。
除了芯片厂商,TogetherAI、Fireworks、Ollama、vLLM、SGLang和智源众智FlagOS、魔搭等海内外开发平台与社区已同步在首日接入MiniMax M2.7模型并完成适配。
模型调用量快速提升
基于其在真实的软件工程、专业办公场景的表现,M2.7已成为在Hermes Agent、OpenClaw等全球热门智能体中最受欢迎的模型之一。
MiniMax介绍,目前来自海内外的开发者与企业客户的接入需求在持续增长,模型调用量在快速提升。
今年3月,MiniMax披露的2025年年报显示,公司期内总收入为7903.8万美元,同比增长158.9%;毛利为2007.9万美元,同比增长437.2%,毛利率提升至25.4%;经调整净亏损为2.5亿美元,上年同期经调整净亏损为2.4亿美元,经调整亏损率有所收窄。
此前数据显示,2026年前两个月,MiniMax模型调用量与新增用户规模均实现大幅跃升,旗下M2系列文本模型2026年2月平均单日Token消耗量,较2025年12月增长6倍以上,产品使用频率实现显著提升。
在今年3月的财报电话会上,MiniMax创始人闫俊杰表示,当前行业释放的增长信号是长期趋势的开端,而非一次性红利。AI行业的增长并非简单的线性增长,而是呈现阶梯式跃升的特征。
他预计,未来一年行业的渗透加速会远 超市 场预期,且增长来源将更加多元,核心集中在三大方向:
一是编程领域仍有极高的成长天花板。当前编程智能的辅助工具能力已趋于成熟,年内有望实现向“同事级协同”“创新性探索”“复杂组织配合”的高阶智能升级。
二是覆盖全职业的办公场景,市场空间更为广阔,将复刻编程领域的高速发展节奏。
三是多模态领域将迎来跨模态融合带来的智能飞跃,让生成内容直接具备可交付性,大幅降低行业渗透门槛。
(文章来源:上海证券报)
主题:MiniMax大动作|基金|沐曦火速适配|新股|美股