万维读者网 > 信息时代 > 正文  

DeepSeek性能比肩OpenAI 成本仅1/30

www.creaders.net | 2025-01-26 12:42:53  联合早报 | 0条评论 | 查看/发表评论

  

  仅相隔两个月,中国初创公司DeepSeek(深度求索)再度发布廉价大模型,其性能可比肩美国OpenAI最新模型。

  综合英国科技周刊《自然》(Nature)和英国科技网站“生命科学”(Live Science)等报道,DeepSeek去年12月发布免费语言大模型DeepSeek V3,并称在两个月内花费558万美元完成训练该模型,所需时间和费用仅硅谷竞争对手的十分之一。

  中国对冲基金幻方量化旗下的子公司DeepSeek星期一(1月20日)发布推理模型DeepSeek-R1,在第三方多个项目的基准测试中均超越美国OpenAI开发的最新模型o1。

  据美国消费者新闻与商业频道(CNBC)报道,美国微软行政总裁纳德拉(Satya Nadella)星期三(1月22日)在达沃斯世界经济论坛上说,DeepSeek的新模型令人印象深刻,不仅因为他们有效地构建一个开源模型,还因为它的推理计算效率极高。“我们应该非常严肃地看待中国人工智能(AI)的发展”。

  除测试表现优于o1外,R1的训练成本和开源开放程度也胜于o1。《自然》周刊报道称,开源开放指的是,让用户参与二次开发,可更改演算法。虽然可自由重复使用,但R1的开源开放程度仍受限,因为训练数据尚未公开。

  《每日经济新闻》引述DeepSeek发布的技术报告称,R1的训练成本是o1的三十分之一。《自然》周刊报道称,R1给用户开出低廉的使用方案,是o1的三十分之一。

  让西方科技界赞叹的是,DeepSeek在受美国限制先进科技输华的背景下,依然开发出新颖模型。

  “生命科学”报道称,美国限制向中企出口先进AI计算芯片,迫使R1研发者采用更智能和有效的演算法,以弥补演算能力的不足。ChatGPT据报需要一万台英伟达(Nvidia)的图像处理器处理训练数据,DeepSeek工程师称他们仅用2000台图像处理器就取得相同结果。

   0


热门专题
1
洛杉矶大火
6
叙利亚
11
三中全会
2
川普
7
苗华被抓
12
中共两会
3
俄乌战争
8
美国大选
13
台湾大选
4
中美冷战
9
以哈战争
14
李克强
5
万维专栏
10
巴黎奥运
15
中国爆雷
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.