从GPU到万物智能到智能普惠，摩尔线程靠“云边端”全栈智算矩阵迈了一大步

速读：夸娥云服务以“算力即服务”的方式，将前沿模型推理能力快速转化为可用的行业应用：现场展示了基于GLM模型推理服务的VibeCoding，用户用口语描述需求即可生成专属App，整个开发由多智能体协同完成，无需手写代码；它深度整合了“智能体+AIPC+AINAS”三大核心能力矩阵，以一站式解决方案赋能家庭智能体验。为承载“小麦”智能体的智慧进化，摩尔线程重磅发布了全新智能家庭AI中枢——MTTAICUBE，标志着AgenticAI将走进千家万户。

从GPU到万物智能到智能普惠，摩尔线程靠“云边端”全栈智算矩阵迈了一大步 _ 东方财富网

2026年05月18日 23:17

K图 688795_0

　　5月18日晚，摩尔线程在北京举办主题为“词元时代，万物智能”的年度产品发布会。在Agentic AI驱动词元（Token）需求呈指数级跃升的关键节点，万物智能处于爆发前夜，算力的基石作用愈发关键。

　　摩尔线程在此次盛会上全方位展示了其作为智算底座的战略纵深，全面展示了“云-边-端”全栈智算矩阵：从万卡级规模的夸娥智算集群，到自研“长江”SoC驱动的智能终端MTT AICUBE和MTT AIBOOK；从数字世界智能体“小麦”，到加速物理AI落地的首个全栈具身智能仿真平台MT Lambda，再到持续进化的MUSA生态。这不仅是摩尔线程核心技术和产品的集中亮相，更标志着其全面打通了“云-边-端”智能算力生态，赋能从数字世界到物理世界的全场景 AI应用。

　　云端筑基：夸娥智算集群，全链路加速大模型训推

　　在智算基础设施领域，摩尔线程以夸娥（KUAE）智算集群为核心，构建起适配词元时代需求的高性能AI基础设施。目前，夸娥万卡级智算集群已经成功落地，多项关键指标达到国际主流水平，在Dense大模型训练中的模型算力利用率（MFU）达60%，在MoE大模型上达40%，有效训练时长达90%，训练线性扩展效率达95%。这标志着摩尔线程已具备支撑超大规模模型稳定训练的硬核实力。

　　大模型训练是一项极为复杂的系统性工程，涵盖预训练、持续预训练（CPT）、长文本训练、微调（SFT）及强化学习（RL）等流程。为赋能开发者，摩尔线程推出夸娥训练套件，覆盖大模型预训练和后训练全链路，包括训练框架、AI框架及训练辅助工具等核心组件，专门优化了对强化学习的支持，兼容业界主流的VeRL训推一体与Slime训推分离框架，并完成了对多项微调框架的适配。面对高达数十万亿Tokens的超大规模数据集，基于摩尔线程万卡级集群训练的科学基础大模型，实现了全流程训练技术的突破，在MMLU等评测指标上的表现持续提升。

　　在推理端，摩尔线程展现了其深厚的生态底蕴与“发布即适配”（Day-0适配）的响应速度。目前，摩尔线程已全面适配DeepSeek、GLM、MiniMax、Kimi、Qwen等国内头部大模型，以及主流的语音、视觉理解及多模态模型。值得一提的是，摩尔线程在推理框架SGLang主线代码中获得了官方原生支持，并开源了vLLM-MUSA，可原生获得摩尔线程GPU加速能力，大幅提升推理效率。

　　夸娥云服务以“算力即服务”的方式，将前沿模型推理能力快速转化为可用的行业应用：现场展示了基于GLM模型推理服务的Vibe Coding，用户用口语描述需求即可生成专属App，整个开发由多智能体协同完成，无需手写代码；同时以AIGC微短剧制作工作流,呈现从剧本策划到视频合成的全链路智能生成，直观展示夸娥在内容创作与智能化应用落地上的强大生产力。

　　终端进阶： “长江”SoC驱动，开启全场景智能

　　发布会上，以“小麦”智能体为核心的端侧AI产品正式亮相。基于情景感知决策、长上下文历史检索、自主任务编排、多模态情绪识别以及跨端协同、端云一体的能力，“小麦”可以提供有温度的专属人格体验。其背后依托三大关键技术支撑：运行于AI原生操作系统MTT AIOS，采用独特的二维拓扑记忆系统，搭载自研Agent开源框架MTClaw。

　　为承载“小麦”智能体的智慧进化，摩尔线程重磅发布了全新智能家庭AI中枢——MTT AICUBE，标志着Agentic AI将走进千家万户。它深度整合了“智能体 + AI PC + AI NAS”三大核心能力矩阵，以一站式解决方案赋能家庭智能体验。AICUBE内置的“小麦”智能体预装60余项技能（Skills），支持超36款APP的跨应用控制，提供智慧化的主动服务；全闪存AI NAS模块则为家庭数据提供了安全、高效的本地存储与智能管理；同时，AICUBE还具备完整的桌面AI PC能力，可满足家庭用户的观影娱乐、高效办公、在线学习、云游戏以及本地大模型运行等全方位需求。

　　与此同时，摩尔线程宣布MTT AIBOOK全面升级。作为“为智能体而生”的笔记本电脑，AIBOOK在MTT AIOS原生Linux系统下，预装原生“龙虾”智能体（OpenClaw），支持多智能体协作，为智能体应用的开发、调试与部署提供完整的闭环解决方案。AIBOOK具备“工具直达”特性，提供90+工具调用接口，降低开发配置成本；并创新支持原生Linux、虚拟化Windows及容器化Android多系统，同时提供LLM/ASR/TTS/OCR等模型支持的“端侧感知”能力，一台设备即可覆盖用户的全场景使用需求。

　　面向端侧和边缘场景，摩尔线程以“长江”智能SoC为核心构建多维产品矩阵：除AICUBE与AIBOOK外，还展示了专为嵌入式边缘场景设计的MTT E300 AI模组，支持混合精度计算，可在严苛环境中稳定运行，为工业质检、能源巡检、智慧教室、具身智能、智能汽车及低空经济等典型场景提供高效、低延迟、强可靠的边缘AI能力。

　　物理跨越：生态闭环，赋能具身智能训练与仿真

　　摩尔线程重磅发布其首个全栈具身智能仿真平台MT Lambda，旨在赋能用户构建数据合成、策略训练、仿真验证的高效工作流。该平台构建了从底层算力、核心引擎到上层框架及工具的完整解决方案：其底层基于全功能GPU，实现渲染、物理、AI计算在同一芯片中完成，数据“零拷贝”；中间层深度融合自研物理、渲染、AI三大引擎；上层则提供MT Lambda-Lab具身策略开发与训练平台以及MT Lambda-Sim高保真物理仿真与渲染平台。在发布会现场，摩尔线程通过机器狗实景演示，直观展现了该平台在具身智能策略开发与动作训练上的突出表现。

　　当前，具身智能加速从技术验证迈向工程化与产业化，摩尔线程作为国内极为稀缺的打通“大模型训练—仿真模拟—端侧部署”生态闭环的GPU企业，已经构建起全栈自主、端到端的软硬件技术栈，可以为具身智能提供一站式、安全可靠的国产算力方案。

　　在具身智能领域，摩尔线程依托自研的夸娥智算集群、仿真平台及端侧SoC芯片，已经形成云边端协同的产品与能力布局。同时，摩尔线程积极拓展具身生态“朋友圈”，通过与光轮智能在合成数据等关键领域共筑国产具身智能仿真底座，以及与光线云联合打造RaysTwins具身仿真平台等深度合作，共同推动技术成果加速转化落地。

　　生态进化： MUSA 100%兼容，开源与开放共建

　　作为贯穿摩尔线程全功能GPU硬件与全栈软件体系的底层架构，MUSA已全面实现对业界主流CUDA生态的深度兼容。最新发布的MUSA SDK 5.1.0，对标CUDA 12.8，从驱动与运行时新增248个API，兼容接口数达到761，到核心数学库的100%对齐，从覆盖55类核心AI算子，到完整支持PyTorch全部3194个算子，MUSA软件栈全链路覆盖了底层驱动、编译器、算子加速库、训练与推理框架，让国产GPU真正具备“即插即用”的开放能力。

　　在开源生态与关键场景中，MUSA也取得了里程碑式的突破：在推理生态上，MUSA不仅正式成为vLLM官方后端，更成功合入SGLang官方主线并获得“原生支持”；在底层编译上，TileLang-MUSA成功合入开源主线，升级支持Trition 3.6最新版本，FlashAttention3等热点算子在MUSA上达到95%的高效率；此外，训练套件产品化支撑超大规模集群与强化学习，推理套件全面适配主流框架。无论是前沿大模型训练，还是科学计算中的VASP加速，MUSA都已交出成熟答卷。

　　更具前瞻性的是，MUSA正引入AI技术加速生态的自我演进。依托Automusify 智能迁移工具的“零干预”自动化转化，MUSA实现了对Top 100 人工智能与Top 100科学计算两大领域加速仓库的100%自动迁移。同时，全新升级的MUSACODE AI 编程助手通过大模型智能体协同，已成功开发并交付超10,000个Kernel算子，基于TileLang自动调优Group GEMM算子实现60%性能提升。

解读：智能不应是特权，而是普惠

　　MUSA不仅是国产GPU的生态底座，更是一个开放、自进化、与开发者共同成长的智能生态。未来已来，摩尔线程此次发布会的意义，不仅仅在于国产GPU单一产品的进化，更在于通过加速算力流动、生态构建，让智能“由虚向实”，让具身智能更普惠，更接近你我的身边。当国产GPU让Token自由流动，智能就不再是少数人的特权，而是每个人身边的日常。

　　文、图/广州日报新花城记者：钟达文

（文章来源：广州日报）

主题：一大步|新股|基金|美股