登录

大厂速度!京东云首发上线MiniMax M 3大模型,推理效率迎跨越式升级


2026-06-02 09:23

今日,MiniMax M3模型正式面向市场发布,京东云JoyBuilder模型开发平台已同步完成接入,并在 第一 时间面向广大用户开放相关服务。

此次技术迭代的核心在于推理性能的显著改善。在应用部署方面,平台结合了自研的推理框架,并深度融合了PD分离部署、KV Cache缓存以及投机采样等多项前沿的推理优化技术。

得益于这一系列底层技术的协同发力,新接入的模型在实际运行中实现了更高的推理吞吐量,整体响应效率也获得了大幅提升。这不仅能为开发者提供更流畅的调用体验,也有望进一步加速前沿大模型在具体业务场景中的落地应用。

相关推荐

京东云率先上线MiniMax M3:显著提升模型推理吞吐

MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。

依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。

MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款�

​MiniMax

​M3

​京东云

荐 AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

主题:模型|MiniMaxM3|推理优化技术