万维读者网 > 信息时代 > 正文  

显然冲着DeepSeek而来 腾讯推出AI模型

www.creaders.net | 2025-03-22 16:24:36  经济日报 | 0条评论 | 查看/发表评论

腾讯宣布推出自研深度思考模型“混元T1”正式版,并同步在腾讯云官网上线。 输入价格为每百万tokens人民币1元(新台币4.5元),输出价格为每百万tokens人民币4元(新台币18元)。 输入价格与行业差距不大,但输出价格为DeepSeek-R1标准时段的四分之一,显然冲着DeepSeek而来。

每日经济新闻报道,该模型以腾讯于3月初发布的“混元Turbo S”为基础打造,是一款能秒回、吐字快、擅长超长文处理的强推理模型。

在体现推理模型基础能力的常见指标方面,例如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于OpenAI o1。 在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。

透过大规模强化学习并结合专项优化,混元T1正式版进一步提升了推理能力。 与先前已上线腾讯元宝的“混元T1-preview”模型相比,综合效果明显提升。

混元T1正式版沿用混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。 这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

今年以来,腾讯混元大模型持续快速迭代,AI似乎已成为腾讯内部最大的驱动力。 腾讯推出深度思考模型T1 Preview和快思考模型Turbo S,并已广泛应用于腾讯元宝、ima、腾讯文档、微信读书、搜狗输入法、QQ浏览器等多款内部产品。 腾讯混元积极拥抱开源,开源模型全面覆盖文本、图像、影片和3D生成等多个模态。

业内认为,这一战略选择的背后,一方面基于腾讯长期以来坚持技术普惠的理念,另一方面也得益于腾讯在用户与产业多端的场景与生态优势,为AI技术的落地提供了广阔空间。

   2


热门专题
1
四中全会
6
何卫东
11
叙利亚
2
中美冷战
7
AI
12
苗华被抓
3
川普
8
中共两会
13
美国大选
4
俄乌战争
9
大S
14
以哈战争
5
万维专栏
10
洛杉矶大火
15
巴黎奥运
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.