![]() |
仅相隔两个月,中国初创公司DeepSeek(深度求索)再度发布廉价大模型,其性能可比肩美国OpenAI最新模型。
综合英国科技周刊《自然》(Nature)和英国科技网站“生命科学”(Live Science)等报道,DeepSeek去年12月发布免费语言大模型DeepSeek V3,并称在两个月内花费558万美元完成训练该模型,所需时间和费用仅硅谷竞争对手的十分之一。
中国对冲基金幻方量化旗下的子公司DeepSeek星期一(1月20日)发布推理模型DeepSeek-R1,在第三方多个项目的基准测试中均超越美国OpenAI开发的最新模型o1。
除测试表现优于o1外,R1的训练成本和开源开放程度也胜于o1。《自然》周刊报道称,开源开放指的是,让用户参与二次开发,可更改演算法。虽然可自由重复使用,但R1的开源开放程度仍受限,因为训练数据尚未公开。
《每日经济新闻》引述DeepSeek发布的技术报告称,R1的训练成本是o1的三十分之一。《自然》周刊报道称,R1给用户开出低廉的使用方案,是o1的三十分之一。
让西方科技界赞叹的是,DeepSeek在受美国限制先进科技输华的背景下,依然开发出新颖模型。
“生命科学”报道称,美国限制向中企出口先进AI计算芯片,迫使R1研发者采用更智能和有效的演算法,以弥补演算能力的不足。ChatGPT据报需要一万台英伟达(Nvidia)的图像处理器处理训练数据,DeepSeek工程师称他们仅用2000台图像处理器就取得相同结果。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
48小时新闻排行榜 | 更多>> |
1 | 惊传:习近平退位只待官宣 三个老人幕后控 |
2 | 惊人内幕:习为这事与王岐山翻脸 |
3 | 高层爆料:是习近平下令处理李文亮 |
4 | 食用油一换 癌死少一半?建议吃2种油 |
5 | 习失势的迹象已无法掩盖 |
6 | 泽连斯基最新表态:同意签矿产协议 但不接 |
7 | 乌军方披露:俄军弹药“一半以上”由这国提 |
8 | 风云突变,崩了 |
9 | 川普突然扔下重磅炸弹 中概股暴跌 |
10 | 川普终于证实了… |
一周博客排行 | 更多>> |
一周博文回复排行榜 | 更多>> |