2月27日,腾讯宣布混元正式发布自研快思考模型Turbo S,区别于Deepseek R1、混元T1等需要“想一下再回复”的慢思考模型,可以“秒回”的混元Turbo S主打更快的任务处理能力——吐字速度提升1倍,首字时延降低44%;并通过架构优化,大幅降低部署成本,帮助更多企业与开发者以更低门槛使用高效AI大模型。
据了解,目前,Turbo S已在腾讯云官网正式上线,并将在腾讯元宝逐步灰度上线。腾讯表示,大模型部署的难点之一是计算成本过高,尤其是传统Transformer模型在处理长文本时,受计算复杂度和KV-Cache限制,训练和推理开销巨大。混元Turbo S采用Hybrid-Mamba-Transformer架构,在保证推理能力的同时,大幅提升计算效率。这是工业界首次在超大型MoE(Mixture of Experts)模型上成功应用Mamba架构,为大模型高效部署提供了全新路径。
快思考不仅仅是“快”,更重要的是能在短时间内做出准确的推理和判断。腾讯表示,混元Turbo S在数学、代码、逻辑推理等短链推理任务中表现更优,结合混元T1慢思考模型的长思维链能力,在高效对话、代码辅助、复杂推理等场景下也具备出色的稳定性和准确性。
据悉,Turbo S已在腾讯云官网正式开放API调用,企业和开发者可直接接入使用。API定价输入为0.8元/百万tokens,输出为2元/百万tokens,相比前代混元Turbo模型价格大幅下降。同时,腾讯元宝也将逐步开启Turbo S的灰度上线。同时,即日起一周内,全体企业与个人开发者皆可免费申请试用Turbo S。
文/广州日报新花城记者:文静
广州日报新花城编辑:龙嘉丽




















































