2月25日,阿里云宣布视频生成大模型万相2.1开源。据悉,此次开源基于Apache2.0协议,开放14B和1.3B两个参数规格的推理代码与权重,支持文生视频和图生视频,开发者可在Github、HuggingFace、魔搭社区下载体验。
在性能表现上,14B版本的万相2.1优势明显,在权威评测集Vbench中总分达86.22%,超越众多国内外模型。1.3B版本性能出色,能在消费级显卡运行,仅需8.2GB显存即可生成480P视频,适合二次开发和学术研究。
技术方面,万相2.1基于主流范式进行创新。自研的因果3DVAE优化了时空处理,结合视频DiT结构和FullAttention机制,保障了视频生成的质量。在训练和推理阶段,采用多种策略提升效率。
万相2.1对开源社区十分友好,支持多种主流框架,方便开发者一键部署。此次开源,是阿里云在大模型开源领域的又一重要举措,此前千问衍生模型已超10万个。
文/广州日报新花城记者:邓莉
广州日报新花城编辑:龙嘉丽








































