![]() |
|
仅相隔两个月,中国初创公司DeepSeek(深度求索)再度发布廉价大模型,其性能可比肩美国OpenAI最新模型。
综合英国科技周刊《自然》(Nature)和英国科技网站“生命科学”(Live Science)等报道,DeepSeek去年12月发布免费语言大模型DeepSeek V3,并称在两个月内花费558万美元完成训练该模型,所需时间和费用仅硅谷竞争对手的十分之一。
中国对冲基金幻方量化旗下的子公司DeepSeek星期一(1月20日)发布推理模型DeepSeek-R1,在第三方多个项目的基准测试中均超越美国OpenAI开发的最新模型o1。
除测试表现优于o1外,R1的训练成本和开源开放程度也胜于o1。《自然》周刊报道称,开源开放指的是,让用户参与二次开发,可更改演算法。虽然可自由重复使用,但R1的开源开放程度仍受限,因为训练数据尚未公开。
《每日经济新闻》引述DeepSeek发布的技术报告称,R1的训练成本是o1的三十分之一。《自然》周刊报道称,R1给用户开出低廉的使用方案,是o1的三十分之一。
让西方科技界赞叹的是,DeepSeek在受美国限制先进科技输华的背景下,依然开发出新颖模型。
“生命科学”报道称,美国限制向中企出口先进AI计算芯片,迫使R1研发者采用更智能和有效的演算法,以弥补演算能力的不足。ChatGPT据报需要一万台英伟达(Nvidia)的图像处理器处理训练数据,DeepSeek工程师称他们仅用2000台图像处理器就取得相同结果。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
24小时新闻排行榜 | 更多>> |
1 | 扮演重要角色 习公主“出山” |
2 | 小胡现身破传言 王沪宁赴疆目的曝光 |
3 | 鹅蛋为什么很少有人吃 也很少有卖 |
4 | 前春晚名嘴赴瑞士安乐死 儿子7年后泪洒镜 |
5 | 滚烫的开水千万别倒下水道 小心后悔都来不 |
48小时新闻排行榜 | 更多>> |
1 | 他才是中南海变天关键一子 |
2 | 趁习不在 公安部人事突变 |
3 | 王毅如“过街老鼠” 党媒装疯卖傻 |
4 | “看到中国正在如此之快地赶上来令人震惊” |
5 | 中国人“生死轮回”的说法 很可能被证实是 |
6 | 扮演重要角色 习公主“出山” |
7 | 张又侠“枪指挥党” 政治局势力版图大变 |
8 | 印航坠机241死 调查出现重大进展 |
9 | 小鲜肉被大38岁女星包养13年 成中国富豪 |
10 | 小胡现身破传言 王沪宁赴疆目的曝光 |
一周博客排行 | 更多>> |
一周博文回复排行榜 | 更多>> |