DeepSeek 寻求融资的消息,就像在平静的湖面扔了颗炸弹。
上周末,外媒透露 DeepSeek 正在寻求至少 3 亿美元的首轮外部融资,估值至少 100 亿美元。虽然官方还没回应,但这消息本身已经激起千层浪。要知道,DeepSeek 一直以来都是圈内最技术理想主义的公司之一:长期拒绝外部融资、不稀释股权、不被商业化时间表绑架。
根据之前的报道,DeepSeek 没有明确的绩效考核和 DDL,研究员可自由组队,甚至没有 AI 行业常见的内卷。当中美核心 AI 开发人员每周工时高达 70-80 小时,DeepSeek 的多数员工下午六七点就会离开公司。背靠幻方量化,DeepSeek 活得更像一家研究机构,而不是典型的创业公司。
很多人认为,放开融资意味着 DeepSeek 正在从神坛走下,变回一个正常的 AI 创业公司。数据、算力、人才竞争的升维,正在逼迫它改变过去的动作。另一方面,虽然 100 亿美元的估值对于创业公司不低,但在 AI 这个看想象力的领域,对比 OpenAI 8520 亿美元、Anthropic 3800 亿美元的估值,以及国内智谱和 MiniMax 约 500 亿美元的量级,DeepSeek 的估值确实显得保守。
为什么要在这个时候融资?核心逻辑变了。
和其他 AI 创业者相比,DeepSeek 的腰杆算是硬的。幻方量化业绩优异,管理规模超 700 亿元,收入可观。反过来说,3 亿美元不少,但对于 DeepSeek 来说,有幻方量化在背后,并不是一定要迈出这一步。我们认为,DeepSeek 启动融资最主要的原因是,竞争的环境变了,特别是人才争夺。
之前梁文锋曾说,顶尖人才可能不在中国,但能自己打造。但现在情况变了,DeepSeek 自己就成了那个被抢夺的对象。 除了加入字节的 DeepSeek-R1 核心作者,被挖走的员工还包括参与早期大模型训练的王炳宣、DeepSeek-OCR 核心作者魏浩然,以及在小米独当一面的 V3 模型关键贡献者罗福莉。这些离职者覆盖了基座模型、推理、OCR 和多模态四条核心技术主线。
让这些人选择离开的当然不只是收入,但收入一定是一个重要原因。越来越多的 AI 公司开始加大人才争夺的力度,比如月之暗面拟授予尚未毕业的实习生公司期权。期权的价值需要市场化定价来估算,如果员工对手中的股权缺乏预期,那么他也很难靠期权去留住核心员工。 因此引入一轮小额融资,既能保证 DeepSeek 的自主权,还能给到核心员工一些明确的回报预期。
梁文锋的策略:不追风口,死磕架构。
过去一年,AI 行业的风向变得很快,但是 DeepSeek 很安静。V3 和 R1 爆火以后,DeepSeek 成为了国内增长最快的 AI App,但前者并没有大力去做推广,也没有把目标放在行业最主流的方向。从去年到今年,AI 行业最受瞩目的趋势有两个:一是多模态生成,二是以 coding 能力为基础的 Agentic 模型和应用。但 DeepSeek 显得非常淡定。
DeepSeek 不是没做到多模态,它做过 Janus-Pro,也做过 DeepSeek-OCR,但更集中于自己路线的开发。比如团队连续发布了瞄准大模型长序列处理提升的论文,以及引入稀疏注意力机制,都是为了在不依赖大幅算力提升的前提下,能处理更长的上下文。 这种判断和创始人梁文锋有关,他认为中国 AI 和美国有一两年差距,但真实的 gap 是原创和模仿之差。
因此 DeepSeek 重视的不仅仅是测试结果乃至模型效果本身,还有能被行业追随、复用的技术发现。
我们为什么依然期待 DeepSeek?
DeepSeek R1 某种程度上是中美 AI 发展的一个重要节点。在此之前,一个公认的观点是,中国 AI 至少落后美国 2-3 年。当高端算力卡被锁住以后,大家会认为中美 AI 的差距会越来越大。DeepSeek 不仅打破了这种叙事,也是和国产芯片适配的重要贡献者,试图打破高性能 GPU 供给受限的现实。
DeepSeek 采用的数据压缩格式是针对下一代国产芯片设计的。更有甚者,开发者发现 DeepSeek 把底层的算子库从主流的 CUDA 和 Triton 语言换成了 TileLang,后者是北京大学杨智团队发起的开源项目。这意味着 DeepSeek 将会在技术底座全面“去美化”。
据多家科技媒体证实,DeepSeek 在 V4 版本的开发过程中,打破了此前优先与英伟达、AMD 合作的行业惯例,拒绝向这两家美国芯片巨头提供预发布版本的访问权限,取而代之的是华为。如果 V4 在华为芯片上跑出有竞争力的性能,它将是全球第一个不依赖英伟达的前沿 AI 模型。 从更宏大的叙事来说,这意味着中国 AI 有希望发展出自己的生态,从而完全逃离来自美国的限制。
开放融资这件事当然说明了 DeepSeek 不是一家能完全对抗商业引力的公司,它随后也一定会做出更多和同行并无二致的商业化举动。但惊喜一定不是突如其来的,每一个惊喜背后一定是长期的技术积累和坚持。 就像梁文锋自己说的,我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。
