刚过去的这个周末,北京中关村国际创新中心,带着“国产GPU第一股”的光环,摩尔线程举行了上市后的第一次重大活动:首届MUSA开发者大会。大会上,摩尔线程一下子拿出了新架构“花港”、夸娥万卡智算集群、全新个人智算平台、硬件级光线追踪加速、突破1000 tokens/s的推理性能等一系列技术,并发布了超节点架构以及图形进化方面的未来规划。
如果说,以往的摩尔线程百分版专注在GPU领域“打地基”,未来则需要同时在科创战场与资本市场长袖善舞,实现两个“场”的相互赋能。摩尔线程创始人、董事长兼首席执行官张建中表示,当前,超大型人工智能的基础设施非常迫切,摩尔线程正希望从算力入手,从芯片到集群,以“加速计算”的能力,利用全功能GPU打造国之重器。
这场开发者大会,无疑是一个标志性的开端。
架构
全功能GPU架构“花港”是开发者大会的重头戏之一。
其支持FP4到FP64的全精度计算,密度提升50%,效能提升10倍。在原有MTFP8的技术下,新增MTFP6/MTFP4及混合低精度端到端加速技术。图形方面,摩尔线程将有能力提供全新的AI生成式渲染架构AGR,用AI加速图形渲染流水线,集成全新光追硬件加速引擎,能够更好支持DirectX 12 Ultimate。
在我国此前比较薄弱的“IP”领域,摩尔线程迈出了追赶的步伐。摩尔线程在大会上宣布,已构建涵盖单指令多线程向量计算核心、多精度张量计算核心等在内的完整IP体系。此外,摩尔线程还强调了花港架构的安全性:安全策略完全自研并集成,通过4层安全架构(安全域、信任域、保护域和功能域),为芯片提供安全守护。

更值得关注的是,摩尔线程宣布,未来将基于该架构推出高性能AI训推一体“华山”芯片,以及专攻高性能图形渲染的“庐山”芯片。其中,“华山”受到了业界更多关注,其算力有多强呢?按张建中的说法:“‘华山’的浮点计算,我们对标目前行业当中最高的两个产品,华山是介于这两者之间的一颗芯片。”行业当中最高的两个产品是什么?张建中没有明说,但业界一般认为应该就是“Hopper”和“Blackwell”——两者都是英伟达芯片家族的成员,特别是考虑到美国即将放开英伟达H200的出口管制,摩尔线程在这个时刻发布“华山”,还是“赶上趟”了,未来就看这款产品会在何时真正上市了。
不过,要说“华山”有什么独门绝技?就必须要说一下这句话:“支持十万卡以上规模智算集群”。
集群
把“集群”单单拿出来说,是因为这个关键词,不仅仅关乎“华山”一个产品,而是摩尔线程乃至我国GPU算力的一项重要“阳谋”。
一个不可否认的事实是,目前国内量产的AI芯片性能“单挑”还比不上国际先进产品,甚至连英伟达的H200和H100也有差距。于是,我国芯片厂商采取了另一个策略:“团战”。特别是当人工智能、大模型等应用场景需要的算力越来越大时,芯片就更需要“组团作战”。但“团战”有一个难题:相当一部分算力必须要“消耗”在芯片之间的通信上——而且,芯片数量规模越大,算力消耗就越大,甚至到了某一个“组团”规模的临界点,加入组团的芯片越多,其算力增长效能就越低。因此,千卡、万卡、十万卡乃至“超节点”的规模智算集群,如何能最大程度发挥“团队力量”,是我国AI芯片产业待解的难题。

而“华山”集成的新一代异步编程技术正是为解决这一难题而来。传统的上一代产品,由于任务分配不均衡,很多计算单元的算力会闲置。而摩尔线程利用异步编程模型把任务自动分配到不同的工作负载,去平衡到每一个计算单元上,这样可以确保每一个计算单元都能够得到不同的任务,让每一个计算单元都不闲着,充分发挥芯片本身的每一个核心算力。
虽然路径不完全一致,但“华山”的“集群作战”效应,与华为昇腾超节点颇有点“异曲同工”。
但,“集群”还远远不是摩尔线程的最大梦想。
生态
之所以叫作“开发者大会”,而不是一般的“发布会”,是因为摩尔线程的长远目标是要打造一个MUSA生态。
摩尔线程的MUSA架构是国内首个实现单芯片同时支持AI智算、图形加速、科学计算与物理仿真、超高清视频编解码的全功能GPU架构。全功能GPU的好处是“图算结合”,实现理解世界(AI计算)、三维构建世界(图形渲染)以及展现世界(超高清视频传输)的融合运作——在虚拟的游戏世界里如此,未来在虚拟与现实融合的世界里也是如此。
英伟达之所以成为王者,是因为CUDA生态。中国工程院院士、清华大学计算机系教授郑纬民在开发者大会上表示,真正决定主权AI成败的,在于是否有足够多的开发者愿意长期在这套栈上写代码。开发者是生态的核心,不是厂家。“因此,国产平台需要解决的问题,是如何让开发者们愿意迁移到国产工具链和社区,让国产工具从‘能用’到‘好用’再到‘愿意用’。”

摩尔线程MUSA就是类似于CUDA生态的国产实践。
也因此,“摩尔学院”的重要性可能被很多人低估了。这个专业GPU技术培训与交流平台,专为GPU开发者、科研人员以及产业实践者设计,提供从入门到精通的全方位培训。学院汇聚行业顶尖专家和生态合作伙伴资源,旨在打造一个全面而深入的课程体系,课程内容广泛覆盖人工智能、数字孪生、加速计算等多个前沿技术领域,帮助学员掌握尖端技术知识,拓展创新视野。截至2025年12月,摩尔学院已经汇聚了20万名先行者和探索者。也许,这20万名探索者,就是中国AI发展的新生力量,也是摩尔线程助力建设“世界级生态”愿景中最具确定性的一环。
“全功能”的背后,其实就是“全生态”,需要时刻保持“生态”式的开放,尽可能跨域兼容,才能把路走得更宽。
因此,“全生态”的雄心背后,其实是另一种谦逊:承认吧,无论是人还是AI,都无法预测未来AI会往哪里走。
文、图/广州日报新花城记者:钟达文
广州日报新花城编辑:龙嘉丽
























































