AI能不能写出真正生产级的大型软件,乃至于大模型训练框架?
今天,面壁智能联合清华大学、OpenBMB开源社区正式发布ForgeTrain——全球首个完全由AI编写、零人类代码介入的生产级大模型训练框架。

据介绍,它不是一个实验原型,而是一套可以直接投入生产、创造价值的AI引擎。
在英伟达H100 GPU上,ForgeTrain的训练速度超越了英伟达自研、业界主流的Megatron框架10%。这意味着在同等任务下,直接节省10%的算力成本。
在华为昇腾系列上,ForgeTrain已完整跑通预训练流程,证明了其强大的跨硬件平台适配能力。
此外,面壁智能使用ForgeTrain在华为昇腾芯片上成功完成了面壁智能新一代小钢炮MiniCPM5-1B模型的预训练。评测结果显示,MiniCPM5-1B的综合性能在全球同尺寸模型中处于领先水平,在AA 榜单上位列2B规模以下Top 1。
这标志着,“AI写的框架→在国产芯片上运行→训练出领先的AI模型”这一完整闭环被成功打通。
面壁智能表示,其将AI制造AI的进化路径划分为L1到L5五个级别,与OpenAI对AGI的L1-L5定级形成呼应,其中ForgeTrain对应L3(AI端到端闭环产出下一代大模型所需的基础设施):

关于AI制造AI的战略意义,面壁智能表示,一旦AI研究AI的速率超过人类研究AI的速率,大模型的研发速度就从人力规模的函数变成算力规模的函数,AGI实现的时间表将被重写。
文/广州日报新花城记者:张露
广州日报新花城编辑:麦晓颖






































