腾讯宣布推出自研深度思考模型“混元T1”正式版,并同步在腾讯云官网上线。 输入价格为每百万tokens人民币1元(新台币4.5元),输出价格为每百万tokens人民币4元(新台币18元)。 输入价格与行业差距不大,但输出价格为DeepSeek-R1标准时段的四分之一,显然冲着DeepSeek而来。
每日经济新闻报道,该模型以腾讯于3月初发布的“混元Turbo S”为基础打造,是一款能秒回、吐字快、擅长超长文处理的强推理模型。
在体现推理模型基础能力的常见指标方面,例如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于OpenAI o1。 在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。
透过大规模强化学习并结合专项优化,混元T1正式版进一步提升了推理能力。 与先前已上线腾讯元宝的“混元T1-preview”模型相比,综合效果明显提升。
混元T1正式版沿用混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。 这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

今年以来,腾讯混元大模型持续快速迭代,AI似乎已成为腾讯内部最大的驱动力。 腾讯推出深度思考模型T1 Preview和快思考模型Turbo S,并已广泛应用于腾讯元宝、ima、腾讯文档、微信读书、搜狗输入法、QQ浏览器等多款内部产品。 腾讯混元积极拥抱开源,开源模型全面覆盖文本、图像、影片和3D生成等多个模态。
业内认为,这一战略选择的背后,一方面基于腾讯长期以来坚持技术普惠的理念,另一方面也得益于腾讯在用户与产业多端的场景与生态优势,为AI技术的落地提供了广阔空间。