近日,一家名为DeepSeek的中国AI企业异军突起——其自研的大模型 DeepSeek-R1在多项国际评测中表现突出,受到国内外市场的追捧,更有市场传出Meta等头部科技企业的工程师正在争分夺秒地分析DeepSeek,同时其还在26日出现了短时闪崩现象。
1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。此前,DeepSeek对外宣称,DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
业内人士表示,DeepSeek的低成本、高性能,以及开源模式,为中国AI产业的发展提供了新的思路和方向,中国AI产业正在加速发展。
来源:DeepSeek公众号
具有高性能低成本开源优势
“DeepSeek爆火的原因主要可以归结为两点:性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。
更为关注的是,DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek 公布了API的定价,每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。这个收费大约是 OpenAI o1运行成本的三十分之一,也因此,DeepSeek被称为AI界的“拼多多”。
“DeepSeek以较低的成本实现了高性能的AI模型,这使得其在市场竞争中具备了显著的优势,这种成本效益比无疑会吸引大量企业和个人用户选择其产品和服务。”北京社科院副研究员王鹏表示。
传统的闭源大模型,往往需要巨大的算力资源和资金投入,这使得中小企业和个人开发者难以参与其中。DeepSeek的开源模式,让更多人能够接触到先进的AI技术,从而推动AI技术的更广泛应用。随着对AI技术的持续突破,以及开放共享的策略,DeepSeek有望吸引更多开发者参与,构建繁荣的生态系统。
成本降低推动大模型应用的普及
郑磊直言,DeepSeek对硬件市场产生了重大影响,因为它可能会降低人工智能模型的硬件成本,从而推动人工智能技术的发展。与此同时,随着成本的降低,大模型的应用可能会变得更加普及,这将进一步推动人工智能技术在各个行业中的应用,如医疗保健、金融、物流、自动驾驶等。
业内普遍认为,DeepSeek的崛起标志着中国大模型技术达到了一个新的台阶。王鹏表示,其高性能、低成本的AI模型在国际市场上取得了显著的优势,这不仅体现了中国在大模型技术上的研发实力和创新能力,也为中国在全球AI竞争中赢得了更多的话语权和影响力。
文/广州日报新花城记者:张露
广州日报新花城编辑 李光曼