![]() |
|
中国人工智能起步公司深度求索(DeepSeek)发布其热门推理模型R1的首次更新版本,称新版R1模型深度思考能力得到强化,整体表现上已接近美国竞争对手OpenAI和谷歌推出的顶尖模型。
DeepSeek星期四(5月29日)晚在官方微信公众号发文称,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。
文章特别提到,更新后的R1模型对“幻觉”问题(错误或误导性输出)进行了优化,在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45%至50%左右。其他方面的提升则包括更贴近人类偏好的创意写作,和更好的前端代码生成、角色扮演能力。
DeepSeek表示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中,取得当前中国“所有模型中首屈一指的成绩”,在整体表现上已接近OpenAI的o3和谷歌的Gemini-2.5-Pro等美国顶尖模型。
DeepSeek同时也说,该公司在蒸馏DeepSeek-R1-0528的思维链后,训练中国科技巨头阿里巴巴的Qwen3-8B基础模型,得到了DeepSeek-R1-0528-Qwen3-8B,在性能上比原版模型高出10%。
DeepSeek称:“我们相信,DeepSeek-R1-0528 的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。”
DeepSeek也将继续开源新版R1模型,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
另据路透社报道,今年1月发布的R1在全球引发热议,导致中国以外的科技股暴跌,挑战了“扩展人工智能需要巨大算力和投资”这一观点。阿里巴巴和腾讯等中国科技巨头此后纷纷发布声称超越DeepSeek的模型。
报道称,DeepSeek的成功也颠覆美国出口管制阻碍中国人工智能进步的看法,因为它以极低成本发布了与美国行业领先模型相当甚至更好的人工智能模型。
为了应对来自DeepSeek的竞争,谷歌的Gemini已推出折扣版本,而OpenAI也降低了价格,并发布对算力要求更低的o3 Mini模型。
DeepSeek曾在3月发布V3大型语言模型的升级版。外界普遍预计DeepSeek将推出R1的后续版本R2,路透社3月曾引述消息人士称,R2最初计划在5月发布。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
24小时新闻排行榜 | 更多>> |
1 | 出事了!习家人集体“消失” |
2 | 关键时刻 中南海最要害部门换将 |
3 | 习突提胡锦涛临别赠言 中国政治面临关键时 |
4 | 习河南陪母拜佛 两句话传回北京 |
5 | 突发:美国开始撤销中国学生签证,重点锁定2 |
48小时新闻排行榜 | 更多>> |
1 | 4个消息来源,网络疯传胡张习讲话稿 |
2 | 北京红墙周边戒严 中南海出事了? |
3 | 出事了!习家人集体“消失” |
4 | 一意孤行 习近平已给出答案 |
5 | 猛虎下山,乌战迎来历史性转折 |
6 | 关键时刻 中南海最要害部门换将 |
7 | 习突提胡锦涛临别赠言 中国政治面临关键时 |
8 | 习河南陪母拜佛 两句话传回北京 |
9 | 突发:美国开始撤销中国学生签证,重点锁定2 |
10 | 他在影射谁?中国大佬言论 网震惊 |
一周博客排行 | 更多>> |
1 | 和为贵:胡锦涛的“先王之道” | 陈家梁子 |
2 | 网传【张又侠政治局批习讲话】 | 蒋大仁勇 |
3 | 绝对不碰“六四” | 艺萌 |
4 | 赵晓:从叶卡捷琳娜看俄罗斯民 | 万维网友来 |
5 | 赵晓:保守主义何以失去了哈佛 | 万维网友来 |
6 | 独裁昏君习近平祸国乱政的“十 | 天机指南 |
7 | 红太阳从绞肉机中升起 | 思芦 |
8 | 生于不义,死于耻辱 | 芦笛 |
9 | 白宫为敲打哈佛助威.奥巴马希 | 木秀于林 |
10 | 八十年代的上海老照片 | 弓长贝占郎 |
一周博文回复排行榜 | 更多>> |