2月5日,由中科曙光提供的3套万卡超集群系统在国家超算互联网郑州核心节点同时上线试运行,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池,全面覆盖万亿参数模型训练、高通量推理、AI for Science等大规模AI计算场景。
国产万卡集群迈入规模化部署与实战应用阶段
去年12月,scaleX万卡超集群在HAIC大会首次真机亮相,不到2个月后,即以超3万卡的AI算力规模落地。这也标志着国产万卡集群已正式迈入规模化部署与实战应用的新阶段。
这背后是复杂的系统工程。中科曙光以系统性创新,攻克高速互联网络、存算传紧耦合设计、高密供电与散热、统一资源高效调度等关键技术难题。
全球智能算力需求爆发,算力基础设施亟须具备生态兼容与弹性扩展等特征,以高效支撑多元应用场景、大幅降低产业使用门槛。曙光scaleX万卡超集群基于AI计算开放架构,可全面兼容CUDA等主流软件生态,支持多品牌国产加速卡混合部署,大幅降低开发者迁移适配门槛,更具备向十万卡、百万卡规模的灵活扩展能力,更好契合产业规模化发展需求。
基于这些优势,scaleX万卡超集群成为国家超算互联网郑州节点的核心AI算力支撑,并依托国家超算互联网实现一体化算力调度,从而可为全球用户提供通用、易用、高效、普惠的中国AI算力。

生态:已完成400多个主流大模型的适配优化
培育繁荣的AI产业,需要构建协同共生的创新生态。scaleX万卡超集群已完成400多个主流大模型、世界模型的适配优化,依托国家超算互联网,更可接入上千款应用,链接更多AI产业生态伙伴,实现“算力+应用”一体化交付。
实际应用中,scaleX万卡超集群持续为多场景提供深度赋能:针对超大规模模型训练,支持万亿参数模型的整机训练与容错恢复;面向高通量推理场景,已服务于多家头部互联网用户的核心智能化业务,并通过联合深度优化持续提升推理效能;在AI for Science领域,支撑国内某材料研发大模型登顶国际权威榜单,助力国内顶级科研团队将蛋白质研究效率提升3-6个数量级;同时搭配OneScience科学大模型一站式开发平台,大幅降低多学科交叉研究的创新门槛。
“智能化的浪潮正以前所未有的力量重塑世界。”中科曙光高级副总裁李斌表示,“我们将以郑州核心节点上线为起点,继续深化技术研发与应用实践,推动国产智能算力更高效、更稳定、更普惠地服务于经济社会发展的各个领域。”
降耗:新一代超算体积整体压缩20%
算力跃升的背后,是日益攀升的耗电量——这也成为摆在国产算力研发团队面前的一道坎。
有统计显示,全国数据中心耗电量已连续8年同比增长超12%,年耗电量远超三峡大坝与葛洲坝电厂发电量总和,其中芯片散热是最耗能的环节。若沿用传统风冷散热,能耗下降瓶颈难以突破。为此,曙光研发团队早在十几年前,便率先布局液体相变冷却散热技术研发。
液体相变只是节能第一步。在不影响算力输出的前提下,进一步实现低碳节能,必须将超级计算机整体体积压缩至极致。中科曙光国家级工业设计中心主任牛旭表示:“我们就是奔着‘压到不能再压’的极限去做,力争短时间内拿出可行性方案。”
降耗之路并非坦途。曙光工业设计团队曾在三天内推翻所有既有设计,从零开始重构方案。最终,团队采用模块化设计理念和高精度制具优化,在提升用户体验的同时,完成了各部件尺寸缩减,成功将新一代超算体积整体压缩20%,结合液体相变冷却技术,实现算力与节能的双向突破。
把能耗降下来、把体积压下去,让算力以更经济、更低碳的方式服务应用场景,未来还将有很长的路要走。
文、图/广州日报新花城记者:钟达文
广州日报新花城编辑:李光曼










































