摩尔线程发布夸娥万卡集群:多项关键精度指标达国际主流水平,MTT C256 超节点架构前瞻亮相

抖音秀 热点资讯 2

12 月 20 日消息,摩尔线程首届 MUSA 开发者大会(简称:MDC 2025)今天在北京中关村国际创新中心正式开幕。

作为国内首个聚焦全功能 GPU 的开发者技术盛会,大会系统展示了摩尔线程以自主 MUSA 统一架构为核心的全栈技术成果,摩尔线程创始人、董事长兼 CEO 张建中在本次大会上正式发布了夸娥万卡智算集群。

据介绍,夸娥万卡集群具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的 AI 训练与推理。

其核心突破包括:浮点运算能力达到 10Exa-Flops,训练算力利用率(MFU)在 Dense 大模型上达 60%,MOE 大模型上达 40%,有效训练时间占比超过 90%,训练线性扩展效率达 95%,与国际主流生态高度兼容,并在多项指标上具备显著能效优势。

在训练侧,摩尔线程基于原生 FP8 能力完整复现顶尖大模型训练流程,并在多项关键精度指标上达到国际主流水平。技术层面实现关键优化:Flash Attention 算力利用率超 95%,并突破 FP8 累加精度等关键技术瓶颈,充分释放国产 GPU 在大模型训练中的性能潜力。

在推理侧,摩尔线程联合硅基流动,经过系统级工程优化与 FP8 精度加速,在 DeepSeek R1 671B 全量模型上实现性能突破:MTT S5000 单卡 Prefill 吞吐突破 4000 tokens/s、Decode 吞吐突破 1000 tokens/s,树立国产推理性能新标杆。

面向未来,摩尔线程还发布了 MTT C256 超节点(注:基于 MTT S5000)的架构规划。

摩尔线程表示,该产品采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力,为下一代超大规模智算中心构建兼具超高密度与极致能效的硬件基石。