2025 年 1 月, DeepSeek R1 正式发布,这极大地改变了 AI 的格局。今天,我将探讨 DeepSeek 的下一步发展,或许也是我们所知 AI 技术的下一个重大飞跃: DeepSeek R2 。
DeepSeek的最新进展

这确实有点不太引人注意,但 DeepSeek 的研究团队最近举办了一场名为“开源周”的活动。在活动期间, DeepSeek团队发布了五个开源项目,以展示他们最近的进展和 AI 领域的进步。
其中最值得注意的是三个工具:
- FlashMLA :这是适用于 Hopper GPU 的高效 MLA 解码内核。
- DeepEP :第一个用于 MoE 模型训练和推理的通信库。
- DeepGEMM :一个可与密集和 MoE GEMM 一起使用的 FP8 GEMM 库。

那么,这一切究竟意味着什么呢?
所有这些工具的设计初衷都是为了让未来的 AI 模型和产品的开发和精简变得更容易、更高效。这也引出了我今天要讨论的主题: DeepSeek R2。
DeepSeek R2:人工智能的下一代进化

DeepSeek 的开源周活动及其展示的产品都与该公司即将发布的备受瞩目的 Reasoning 2 或 R2 模型紧密相关,该模型将是对之前的DeepSeek R1 模型的重大升级。
对于那些还没有关注DeepSeek相关新闻和发布的人,我将分解一下基本内容:
DeepSeek R1 由中国研发,并于 2025 年初推出。这在人工智能领域堪称一件大事,部分原因在于它在全球股市引发了超过 1 万亿美元的抛售。原因何在?因为 R1 是一款如此先进、革命性的模型,完全有能力与西方大品牌的顶尖人工智能模型相媲美。

测试表明,它在许多方面相当于或优于以下产品:
- Claude
- GPT-4o
- OpenAI-o1-mini
- 以及其他许多人
它做到了这一切,同时保持了开源和免费访问的原则。这在当时堪称开创性的,我和全球众多被这个故事震撼的人工智能爱好者一样:一家中国小型初创公司竟然能够达到与OpenAI等价值数十亿美元的巨头同等的技术水平。
但 R1 发布后不久,我和许多其他人就开始疑惑:“下一步是什么?”

路透社最近发布了一篇报道,透露 DeepSeek 的开发团队正急于在 5 月份推出 R2 模型。所以我们可能很快就会看到它,而且我可以肯定地告诉你:这个新模型将比 R1 更显著地改变人工智能格局。
R2的影响
以下是我对 R2 的期望:
- 它会非常便宜,就像 R1 一样
- 它将匹敌甚至超越 OpenAI 的 o3-full 或 o3-high 等领先模型
- 它将超越市场上几乎所有其他型号
如果最新报道属实,它很快就会DeepSeek。DeepSeek 的杭州团队似乎迫不及待地想要发布它,我个人预测它可能会在中国清明节假期(5 月 6 日)后发布,所以请留意你的日历。
据称, DeepSeek团队正致力于编写比以往更优质的代码,并在多种语言(而非仅限于英语和中文)上实现更佳性能,而英语和中文是 R1 的主要功能和默认选项。这并非偶然,因为DeepSeek R1 在全球范围内广受欢迎,人们也希望使用西班牙语、法语、俄语等语言与 R2 进行交互。
我们只需回顾一下 R1 的影响,就能预测 R2 可能如何影响全球市场。R1 的发布导致股市大幅下跌,NVIDIA 股票、加密货币以及全球股票等在其发布后的几天内均大幅下跌。这当时让我惊叹不已,因为我们几乎从未见过这样的情况。

究竟为什么会发生这种情况?部分原因是 R1 采用的是性能较低、老旧的 NVIDIA 芯片,而不是最新的芯片,因此从这个角度来看,NVIDIA 的最新技术的价值和影响力都降低了。这也给西方主要的 AI 科技巨头带来了巨大的竞争,导致它们及其产品的估值下降。
R2 的推出也可能带来类似的影响。它可能会打破OpenAI和Google等大型人工智能公司的主导地位,再次撼动整个行业格局,并证明构建出色的人工智能模型并不一定需要使用绝对尖端、最新、最好的芯片和其他硬件。

DeepSeek 的成功秘诀
说到这儿,你或许会想:“DeepSeek 令人难以置信的成功背后究竟隐藏着什么秘密?” 嗯,我想我已经找到了答案。DeepSeek 成功的关键在于他们在 AI 开发领域快速创新,敢于打破常规,并采取与大型成熟公司不同的做法。
技术创新
这其中很大一部分源于对计算能力的巨额投资。DeepSeek 的母公司投入巨资购买计算硬件,例如最先进的超级计算集群 Firefly。Firefly 使用了数千块 NVIDIA 800 芯片,成本远低于最新芯片,这使得DeepSeek能够以相对较小的预算构建出令人惊叹的人工智能。
其实,这背后还有一段挺有意思的故事。DeepSeekDeepSeek的公司在 2020 年和 2021 年斥资约 12 亿元人民币,购置了两个超级计算 AI 集群。这两个集群由约 10,000 块 NVIDIA 800 芯片组成,这笔采购引起了中国一些大型监管机构的关注。

这些机构质问DeepSeek为什么要购买这么多芯片,团队不得不解释他们正在进行的研究。最终,他们得到了监管机构的“全部批准”,得以继续推进。与此同时,西方人工智能公司使用的高端NVIDIA芯片数量甚至更多——多达5万块——而这些芯片实际上已被禁止出口到中国。
因此, DeepSeek不得不应对质量较差的芯片,但仍然坚持运行,专注于效率而非峰值性能,并尽可能地从现有组件中获取价值。这也意味着更低的计算成本和开销,这些成本和开销最终转嫁给了最终用户——像你我这样的人。
制定标准
DeepSeek初步搭建好基础设施后,便能够推进创新,扩大工作规模,并以经济高效的方式开发不同的 AI 模型和系统。他们的模型在基准测试中甚至距离官方公布的世界最佳成绩仅差 4.5 分。

这真是让我惊叹不已,也让我对 R2 更加期待。因为如果 R1 已经如此接近业内最佳,那么 R2 几乎肯定会更上一层楼,取得更大的成就。R2 发布后,我们非常期待看到它究竟有多么令人印象深刻,与其他模型相比表现如何,以及其他公司如何追赶DeepSeek。
公平定价
还有价格因素。DeepSeek的DeepSeek如此优秀且价格实惠,很快就放弃了OpenAI 的订阅,转而使用DeepSeek 。
我们甚至看到OpenAI不得不迅速降低其定价计划,因为DeepSeek比OpenAI当时的收费便宜 40 倍,现在回想起来,这仍然让我感到震惊。

当然,我们目前对 R2 的定价还不太了解,但我预计DeepSeek不会在新机型上做出太多策略上的改变。它应该仍然是一个价格实惠的选择,让尽可能多的人能够使用高端 AI 技术,而无需支付高昂的月费。
此外,随着DeepSeek在其开源活动上发布这些新工具,人工智能开发的门槛进一步降低,价格也更加实惠。因此,R2 的价格可能比最初的 R1 型号更便宜,这将真正在整个人工智能领域乃至更广阔的领域引发轰动。
为DeepSeek R2版本做好准备
总的来说,我对DeepSeek即将发布的 R2 版本感到非常兴奋。所有迹象都十分积极,表明这个新的开源模型不仅会比 R1 更出色,甚至会比我们迄今为止见过的任何其他 AI 模型都更胜一筹。它将在各个方面都更快、更智能、更卓越,而且我们甚至可能以更优惠的价格买到它。敬请关注后续更新。