![]() |
|
仅相隔两个月,中国初创公司DeepSeek(深度求索)再度发布廉价大模型,其性能可比肩美国OpenAI最新模型。
综合英国科技周刊《自然》(Nature)和英国科技网站“生命科学”(Live Science)等报道,DeepSeek去年12月发布免费语言大模型DeepSeek V3,并称在两个月内花费558万美元完成训练该模型,所需时间和费用仅硅谷竞争对手的十分之一。
中国对冲基金幻方量化旗下的子公司DeepSeek星期一(1月20日)发布推理模型DeepSeek-R1,在第三方多个项目的基准测试中均超越美国OpenAI开发的最新模型o1。
除测试表现优于o1外,R1的训练成本和开源开放程度也胜于o1。《自然》周刊报道称,开源开放指的是,让用户参与二次开发,可更改演算法。虽然可自由重复使用,但R1的开源开放程度仍受限,因为训练数据尚未公开。
《每日经济新闻》引述DeepSeek发布的技术报告称,R1的训练成本是o1的三十分之一。《自然》周刊报道称,R1给用户开出低廉的使用方案,是o1的三十分之一。
让西方科技界赞叹的是,DeepSeek在受美国限制先进科技输华的背景下,依然开发出新颖模型。
“生命科学”报道称,美国限制向中企出口先进AI计算芯片,迫使R1研发者采用更智能和有效的演算法,以弥补演算能力的不足。ChatGPT据报需要一万台英伟达(Nvidia)的图像处理器处理训练数据,DeepSeek工程师称他们仅用2000台图像处理器就取得相同结果。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
48小时新闻排行榜 | 更多>> |
1 | 中国经济再传重大利空信号 |
2 | 中国痛失140亿美金超大订单 |
3 | 直击上海南京路世茂广场 冷清景象令人震惊 |
4 | 何卫东最新消息流出,习前景不妙 |
5 | 惊叹!这则“谣言”又兑现了 |
6 | 中国经济永久衰退?美女经济学家:大错特错 |
7 | 习自曝要退位 或已身不由已 |
8 | 突发!传火箭军新司令王厚斌被抓 |
9 | 中国大爷大妈们这下慌了 |
10 | 亮瞎眼,原来大家真的误会川普了 |
一周博客排行 | 更多>> |
一周博文回复排行榜 | 更多>> |