变天了 DeepSeek自砍一刀 AI价格腰斩

www.creaders.net | 2025-10-03 20:18:26 科技狐 | 0条评论 | 查看/发表评论

太卷了，又降价了！DeepSeek 这是铁了心要当 AI 圈的价格屠夫。

最近（9 月 29 日晚），DeepSeek 官宣全新模型 V3.2-Exp 正式发布并开源，紧接着，API 价格也跟着跳水。

降价还不是象征性地降一点，而是直接腰斩：成本直接砍掉 50% 以上，输出价格甚至暴跌 75%。

API 输入价格（缓存命中）从每百万 tokens 0.5 元降到 0.2 元，输出价格从 12 元砍到只剩 3 元，简直是三折跳楼甩卖的力度。

而且是马上生效，毫不拖泥带水，这波速度，属实带点国产厂商的豪爽气质。

这也让 DeepSeek 的 V3.2-Exp，成为了“性价比最高”的 API 之一。

其实老狐觉得连之一都可以省略了，目前主流 AI 大厂，能给到这个价格的，几乎一个没有。

网友们看完新报价直接发出灵魂拷问：“百万输出 3 块，这谁卷得过呀？”

值得一提的是，这波降价不是瞎搞促销，而是人家真在底层模型上做了优化。这一切的关键，是这次发布的 V3.2-Exp 模型核心创新技术：DeepSeek Sparse Attention（稀疏注意力机制，简称 DSA）。

为啥这玩意这么重要？稍微跟狐友们科普一下：

听着很抽象对吧？但其实你可以把它想象成一种“聪明的省电模式”。传统的注意力机制是每个 token 都要跟其他所有 token 打招呼，一句话几十个字，它们内部得互相问好几十次，累不累？

当然累啊，不仅计算慢，还特别烧钱（你懂的，服务器、GPU、电费、维护啥的都不是小钱）。

而 DSA 这个新招数呢？它只让重要的 token 说话，不重要的就自动闭麦，节省了大量计算资源和时间。

结果就是：推理更快了，成本更低了，关键是模型表现还没掉链子，跟前一版本 V3.1-Terminus 的水平差不多。就是说，在不牺牲效果的前提下，成功把算力这口锅轻了好几斤。

为啥叫“Exp”？因为这是个实验性版本，意思是团队在探索新架构的路上，迈出的关键一步，不是最终版本，但已经实用到可以全面开用。所以你现在用到的 DeepSeek API，全都已经是这个新模型了。

如果你是开发者，恭喜你，没动代码，调用成本直接砍半，喜提史上最值更新。

如果你还想对比下老模型的效果，DeepSeek也很贴心地保留了 V3.1-Terminus 的 API 接口直到 10 月 15 日，修改个 base_url 就能切换测试，不影响当前价格。

真学术范十足的安排，官方都劝你自己实测，不怕 PK，实力说话。

咱们再从开发者的角度，直白点说这波更新到底有多香。

比如你做长文本处理的，文档摘要、历史对话、代码分析这种，最怕的就是上下文太长，token 一多，价格跟着飙，跑一次你得犹豫半天。

这回好了，DSA 专门优化了“长上下文”任务的推理效率，成本一下就被拉下来了。再长的上下文也不用担心破产式调用了，终于能踏实跑大任务了。

而从模型训练的角度，V3.2-Exp 的开发过程其实也是科技感拉满。他们这次用的是“专家蒸馏+统一强化学习”双管齐下策略。

先是针对数学、编程、逻辑推理等多个领域，各自训练出了专精模型，再把这些“专家”的知识整合进最终大模型中（这波叫做蒸馏）。

然后在强化学习阶段，用一种新的 GRPO 策略（Group Relative Policy Optimization），把智能体能力、人类偏好（alignment）、推理水平全融合到一次训练中。

这样训练有两个好处：

每个领域都不落下，性能均衡

不会出现“新技能学了，旧知识忘了”的灾难性遗忘问题

更硬核的是，DeepSeek 还把 GPU 算子开源了，两套版本，TileLang 和 CUDA 全放出来了，研究、部署、二开随你选，开源力度拉满。MIT协议，不限商用，真诚到令人发指。

你要做本地部署？也OK。Docker 镜像准备好了，还兼容各种硬件平台，包括 NVIDIA H200、AMD MI350、甚至国产 NPU。

而这波重磅发布的时间点嘛……DeepSeek又一次选择了节前。

没错，他们是真的热爱在大家放假前丢重磅炸弹。前有 V3.1、再有 Terminus，这次 V3.2-Exp 又赶在国庆之前放出，这公司更新节奏，堪比高铁发车。

不过，也不是没人质疑：你这几次都是“小步快跑”，真正的大招呢？比如一直被期待的 V4、R2，什么时候上线？

甚至在 X（原推特）上就有海外网友留言问 DeepSeek：“你们啥时候发 V4？”底下有人直接回：看这节奏，短期内怕是看不到。

其实从这次发布内容来看，V3.2-Exp 已经是迈向 V4 的关键中间步骤了。

尤其是 DSA 架构的引入，为千亿参数级别的大模型做了前期验证，等下一波大规模模型上线，很可能就是在这个基础上完成的。

所以说，这波 DeepSeek 降价不仅不是“营销噱头”，反而更像是“提前放出未来技术红利”。你可以把 V3.2-Exp 看作一款“技术预告片”，但这预告片本身就已经能跑商用、能降成本、还能开源拿去部署。

这放在全球 AI 厂商里，真没几个能做到。

有人说，在开源模型竞争白热化的今天，留住开发者靠的不是光说不练，而是持续优化体验+价格给到位+社区透明度高。这次 DeepSeek 显然是三管齐下，全拿下了。

相比之下，大多数厂商仍在拼参数、拼能力、拼精度，但 DeepSeek 选择了另一条更难模仿的道路：卷服务成本，卷研发效率，卷开源透明度。

这种扎实且高门槛的优势，才是真正构筑护城河的核心。或许，是时候重新评估国产大模型实力了。

相关新闻

可怕！美专家警告：AI误判恐在几分钟内引爆核战	华尔街分析师：2026年最看好的5支AI概念股
辉达携手台积电冲刺中企200万颗H200大单	14亿年薪还不够美巨头再砸140亿收购华人AI公司
中国AI机器人“造反”视频疯传	豪掷20亿：Meta收购Manus，肖弘出任副总裁
软银卖光英伟达持股含泪完成对OpenAI承诺	60后到00后，我家两代4位程序员戳中的残酷真相
最强7大AI工具排行榜出炉最大黑马杀出	他杀死83岁母亲！AI的温柔正在杀人
硅谷一线峰会，这一幕令大佬们清醒	长期与AI聊天，会诱发这种精神病
YouTube推荐影片1/5竟是“AI废片”	174名北大学生能否考过AI？结果很意外
人类正走进高度不确定未来 AI教父最深层恐惧	暴跌27.5%！美国码农，正被“大屠杀”
北大老师专为AI设计的期中考试结果出乎意料	华为全球悬赏300万人民币求解难题
连人形机器人公司自己都认为，这项技术炒过头了	北大老师太狠了结果意想不到

“人工智能AI”

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

更多>>

1	明明是世界领土大国，她偏要伪装成弹丸小国
2	爆北京拉响警报：2026头号风险浮出水面
3	中国金融圈炸锅，投行“第一美女”栽了
4	北京七环隧道大爆炸传出惊人内幕
5	消息：中共少校飞行员驾机自戕身亡

48小时新闻排行榜

更多>>

1	波兰参战了
2	要玩真的了！他点名警告习近平
3	明明是世界领土大国，她偏要伪装成弹丸小国
4	万劫不复！中国正在重演晚清最后十年
5	会议内幕曝光！习等四人遭“围攻”
6	更多人出事？北京流传神秘名单
7	北京大秀肌肉时刻，一张“致命照片”被公布
8	爆北京拉响警报：2026头号风险浮出水面
9	中国金融圈炸锅，投行“第一美女”栽了
10	北京七环隧道大爆炸传出惊人内幕

热门专题

1 俄乌战争	6 四中全会	11 中共两会
2 中日关系	7 美伊冲突	12 大S
3 中美冷战	8 以伊战争	13 洛杉矶大火
4 万维专栏	9 何卫东	14 叙利亚
5 川普	10 AI	15 苗华被抓

一周博客排行

更多>>

1	2026年1月1日A4白纸自由宣言	万维网友来
2	刷屏的美国“斩杀线”与中共的	解滨
3	回国杂感：仓颉造字成真，有图	思芦
4	（图文）不受欢迎的圣诞	范学德2
5	梅兰芳和兩位仍然在世的入室弟	玉质
6	中共倒台路径预测	遍地是贪官
7	安芃：男人的出轨和女人的出轨	水沫
8	中共国的金融危机何时爆发？	山蛟龙
9	美国斩杀线：愚昧和麻木	汪翔
10	美国巨变：特朗普把三大最争议	文礼

一周博文回复排行榜

更多>>

1	台湾问题：麻将停牌	随意生活
2	中共倒台路径预测	遍地是贪官
3	梅兰芳和兩位仍然在世的入室弟	玉质
4	川普到底卖了乌克兰没有？	山蛟龙
5	第一美女：《越人歌》-宋祖英	YOLO宥乐
6	做这道题，知道明年你要去哪？	末班车
7	中共国的金融危机何时爆发？	山蛟龙
8	关于离岸爱国	阿里克斯Y
9	海外中文出版的新路基本开通，	高伐林
10	70%美国大学毕业生找不到工作	乐维


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.