衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

也是神奇,价格屠夫DeepSeek,破天荒要涨价了!

这两天不少开发者收到了DeepSeek官方邮件,说DeepSeek V4正式版会在下个月(7月)上线。

但事情突然不对劲起来——高峰时段,API的输入token(缓存命中)、输入token(缓存未命中)、输出token,价格统统x2。



不过,价格屠夫的地位毕竟摆在那儿,哪怕是高峰时段涨价,大家也还是连连感叹,真便宜啊真便宜。

大多人都和0xSupergemma的创始人Jun Song一样:



真·反常,DeepSeek V4正式版高峰期价格x2

DeepSeek模型涨价,这还真是大姑娘上轿头一回

它过去留给大家的印象太鲜明了:便宜。

甚至是会把同行价格体系打出一个坑的便宜。

从V3到R1再到预览版V4,不断破圈的DeepSeek每次让人眼前一亮又一亮,一方面是模型能力本身出色,与此同时,价格也是它最锋利的一把刀。

今年4月,V4预览版本身就已经很便宜。

而且当时发布后仅2天,DeepSeek就宣布了一次降价。

输入输出2.5折的基础上,命中缓存的输入折上折再打1折,且输入缓存的折扣没有规定时限。

当时,DeepSeek研究员陈德里在上发帖称,“输入缓存是永久降价”。



所以,这次乍一看邮件,很多人还是发出了意料之外的“咦”的声音。

不过仅是高峰时段涨价,即凌晨1:00至4:00和上午6:00至10:00(均为世界协调时)。

其它时段价格还是维持原有的地板价。

DeepSeek这种没有直接把日常价格整体抬上去,而是通过高峰期调价来做负载管理的办法,给人一种“我也想便宜,但家人们我真的有点扛不住”的feel。

以及回头看DeepSeek最近的一系列动作,就会发现一些蛛丝马迹,觉得这次涨价也不是那么突然。

算力是真紧张,自建数据中心那是相当迫在眉睫。

4月,他家放出新的招聘岗位,开招数据中心高级运维工程师、数据中心高级交付经理,“负责数据中心从立项、建设、交付至运营的全流程项目管理”。

数据中心选择的落点是乌兰察布,国家”东数西算”工程八大枢纽节点之一,内蒙古算力集群的核心组成部分。

从那个时候起,这家以“低成本算法奇迹”著称的公司几乎从那个时候起就把数据中心这事儿摆在了很重要的位置上。

本月月初,DeepSeek又开了“IDC设计规划工程师”岗位招土木老哥。

这属于算力基建、通信基建核心技术岗,负责数据中心从前期选址、方案、布局到施工图、落地配套的全流程规划设计,是机房建设前期核心技术负责人。

前两天它的大规模招聘帖里,也能看到超算集群研发工程师等相关岗位。



DeepSeek V4预览版的这几个问题常被提及

但涨价不是白涨的!

DeepSeek在邮件里明明白白说了:

此次更新将带来更多的功能优化和性能提升。



比如推特网友@teortaxesTex就发现了一些端倪:



除了这一点外,跑了两个多月,V4预览版其实已经积累了不少用户反馈。

被提得比较多希望有改进的,主要有以下几个。

一个是幻觉率偏高。

V4预览版在一些任务里会较为高频地给出很自信但不太靠谱的回答。

普通聊天还好,但对写代码、查资料、做研究的人来说,就会比较难受。

一个是超长上下文的实际稳定性还不够收敛。

V4是“百万上下文窗口”,但实际体验并不尽如人意。

上下文堆积、复杂推理或多轮工具调用叠加时容易不稳定或直接炸掉,这类问题在agent workflow(多工具调用、多轮决策)中更明显。

不过这也是MoE模型的通病了……

第三个是希望复杂代码任务能表现更好。

一方面,面对复杂代码任务,V4的回答有时会显得过度保守。

另一方面有开发者反馈,在真实代码审查类测试里,V4会出现明显的“过度标记问题”,也就是把大量正常逻辑当成潜在bug来提示。

以及DeepSeek在文本和推理上已经足够有存在感,大家一直都在期待D家模型来点原生多模态,一刀把价格砍下去!

综上所述,大概大家的要求也就一点点,无非是能力要强、价格要低、速度要快、上下文要长、代码要准。

最好多模态也补上。

你看,我们也没有很贪心,就是一丢丢朴实的小愿望而已。

挺好的,也是推着DeepSeek往前走的一股力量~

参考链接:
[1]
https://x.com/jun_song/status/2071552338243076310?s=20
[2]
https://x.com/teortaxesTex/status/2071367631269986648?s=20