BrowserGPT

BrowserGPT

探索最强大的一体化 ChatGPT 网络助手。

了解 BrowserGPT
了解 BrowserGPT
生产率
Google Doc

输入 // 即可在 Google 文档上书写时享受我们的 AI 帮助。

Gmail

输入 // 制作引人注目的电子邮件和个性化回复。

侧边栏

探索更强大的 Bing Chrome 侧边栏替代方案。

搜索引擎

在典型搜索结果中查找 HIX.AI 的综合回复。

快速查找栏

在线选择任何文本进行翻译、重写、总结等。

社交媒体
Twitter

输入 // 来撰写简洁而强大的 Twitter 发布这一趋势。

Instagram

输入 // 为您的 Instagram 帖子创建引人入胜的标题。

Facebook

输入 // 以起草与您的社区互动的互动 Facebook 帖子。

Quora

输入 // 以在 Quora 上提供有价值的、已被点赞的答案。

Reddit

输入 // 来制作能引起特定社区共鸣的 Reddit 帖子。

YouTube

一键汇总 YouTube 长视频。

首页 > 人工智能聊天 > DeepSeek R2:颠覆性的全新开源模型

DeepSeek R2:颠覆性的全新开源模型

2025 年 1 月, DeepSeek R1 正式发布,这极大地改变了 AI 的格局。今天,我将探讨 DeepSeek 的下一步发展,或许也是我们所知 AI 技术的下一个重大飞跃: DeepSeek R2

DeepSeek的最新进展

deepseek-r2-1.png

这确实有点不太引人注意,但 DeepSeek 的研究团队最近举办了一场名为“开源周”的活动。在活动期间, DeepSeek团队发布了五个开源项目,以展示他们最近的进展和 AI 领域的进步。

其中最值得注意的是三个工具:

  • FlashMLA :这是适用于 Hopper GPU 的高效 MLA 解码内核。
  • DeepEP :第一个用于 MoE 模型训练和推理的通信库。
  • DeepGEMM :一个可与密集和 MoE GEMM 一起使用的 FP8 GEMM 库。
deepseek-r2-2.png

那么,这一切究竟意味着什么呢?

所有这些工具的设计初衷都是为了让未来的 AI 模型和产品的开发和精简变得更容易、更高效。这也引出了我今天要讨论的主题: DeepSeek R2。

DeepSeek R2:人工智能的下一代进化

deepseek-r2-3.png

DeepSeek 的开源周活动及其展示的产品都与该公司即将发布的备受瞩目的 Reasoning 2 或 R2 模型紧密相关,该模型将是对之前的DeepSeek R1 模型的重大升级。

对于那些还没有关注DeepSeek相关新闻和发布的人,我将分解一下基本内容:

DeepSeek R1 由中国研发,并于 2025 年初推出。这在人工智能领域堪称一件大事,部分原因在于它在全球股市引发了超过 1 万亿美元的抛售。原因何在?因为 R1 是一款如此先进、革命性的模型,完全有能力与西方大品牌的顶尖人工智能模型相媲美。

deepseek-r2-4.png

测试表明,它在许多方面相当于或优于以下产品:

它做到了这一切,同时保持了开源和免费访问的原则。这在当时堪称开创性的,我和全球众多被这个故事震撼的人工智能爱好者一样:一家中国小型初创公司竟然能够达到与OpenAI等价值数十亿美元的巨头同等的技术水平。

但 R1 发布后不久,我和许多其他人就开始疑惑:“下一步是什么?”

deepseek-r2-5.png

路透社最近发布了一篇报道,透露 DeepSeek 的开发团队正急于在 5 月份推出 R2 模型。所以我们可能很快就会看到它,而且我可以肯定地告诉你:这个新模型将比 R1 更显著地改变人工智能格局。

R2的影响

以下是我对 R2 的期望:

  • 它会非常便宜,就像 R1 一样
  • 它将匹敌甚至超越 OpenAI 的 o3-full 或 o3-high 等领先模型
  • 它将超越市场上几乎所有其他型号

如果最新报道属实,它很快就会DeepSeek。DeepSeek 的杭州团队似乎迫不及待地想要发布它,我个人预测它可能会在中国清明节假期(5 月 6 日)后发布,所以请留意你的日历。

据称, DeepSeek团队正致力于编写比以往更优质的代码,并在多种语言(而非仅限于英语和中文)上实现更佳性能,而英语和中文是 R1 的主要功能和默认选项。这并非偶然,因为DeepSeek R1 在全球范围内广受欢迎,人们也希望使用西班牙语、法语、俄语等语言与 R2 进行交互。

我们只需回顾一下 R1 的影响,就能预测 R2 可能如何影响全球市场。R1 的发布导致股市大幅下跌,NVIDIA 股票、加密货币以及全球股票等在其发布后的几天内均大幅下跌。这当时让我惊叹不已,因为我们几乎从未见过这样的情况。

deepseek-r2-6.png

究竟为什么会发生这种情况?部分原因是 R1 采用的是性能较低、老旧的 NVIDIA 芯片,而不是最新的芯片,因此从这个角度来看,NVIDIA 的最新技术的价值和影响力都降低了。这也给西方主要的 AI 科技巨头带来了巨大的竞争,导致它们及其产品的估值下降。

R2 的推出也可能带来类似的影响。它可能会打破OpenAI和Google等大型人工智能公司的主导地位,再次撼动整个行业格局,并证明构建出色的人工智能模型并不一定需要使用绝对尖端、最新、最好的芯片和其他硬件。

deepseek-r2-6-2.png

DeepSeek 的成功秘诀

说到这儿,你或许会想:“DeepSeek 令人难以置信的成功背后究竟隐藏着什么秘密?” 嗯,我想我已经找到了答案。DeepSeek 成功的关键在于他们在 AI 开发领域快速创新,敢于打破常规,并采取与大型成熟公司不同的做法。

技术创新

这其中很大一部分源于对计算能力的巨额投资。DeepSeek 的母公司投入巨资购买计算硬件,例如最先进的超级计算集群 Firefly。Firefly 使用了数千块 NVIDIA 800 芯片,成本远低于最新芯片,这使得DeepSeek能够以相对较小的预算构建出令人惊叹的人工智能。

其实,这背后还有一段挺有意思的故事。DeepSeekDeepSeek的公司在 2020 年和 2021 年斥资约 12 亿元人民币,购置了两个超级计算 AI 集群。这两个集群由约 10,000 块 NVIDIA 800 芯片组成,这笔采购引起了中国一些大型监管机构的关注。

deepseek-r2-7.png

这些机构质问DeepSeek为什么要购买这么多芯片,团队不得不解释他们正在进行的研究。最终,他们得到了监管机构的“全部批准”,得以继续推进。与此同时,西方人工智能公司使用的高端NVIDIA芯片数量甚至更多——多达5万块——而这些芯片实际上已被禁止出口到中国。

因此, DeepSeek不得不应对质量较差的芯片,但仍然坚持运行,专注于效率而非峰值性能,并尽可能地从现有组件中获取价值。这也意味着更低的计算成本和开销,这些成本和开销最终转嫁给了最终用户——像你我这样的人。

制定标准

DeepSeek初步搭建好基础设施后,便能够推进创新,扩大工作规模,并以经济高效的方式开发不同的 AI 模型和系统。他们的模型在基准测试中甚至距离官方公布的世界最佳成绩仅差 4.5 分。

deepseek-r2-8.png

这真是让我惊叹不已,也让我对 R2 更加期待。因为如果 R1 已经如此接近业内最佳,那么 R2 几乎肯定会更上一层楼,取得更大的成就。R2 发布后,我们非常期待看到它究竟有多么令人印象深刻,与其他模型相比表现如何,以及其他公司如何追赶DeepSeek。

公平定价

还有价格因素。DeepSeek的DeepSeek如此优秀且价格实惠,很快就放弃了OpenAI 的订阅,转而使用DeepSeek 。

我们甚至看到OpenAI不得不迅速降低其定价计划,因为DeepSeek比OpenAI当时的收费便宜 40 倍,现在回想起来,这仍然让我感到震惊。

deepseek-r2-9.png

当然,我们目前对 R2 的定价还不太了解,但我预计DeepSeek不会在新机型上做出太多策略上的改变。它应该仍然是一个价格实惠的选择,让尽可能多的人能够使用高端 AI 技术,而无需支付高昂的月费。

此外,随着DeepSeek在其开源活动上发布这些新工具,人工智能开发的门槛进一步降低,价格也更加实惠。因此,R2 的价格可能比最初的 R1 型号更便宜,这将真正在整个人工智能领域乃至更广阔的领域引发轰动。

为DeepSeek R2版本做好准备

总的来说,我对DeepSeek即将发布的 R2 版本感到非常兴奋。所有迹象都十分积极,表明这个新的开源模型不仅会比 R1 更出色,甚至会比我们迄今为止见过的任何其他 AI 模型都更胜一筹。它将在各个方面都更快、更智能、更卓越,而且我们甚至可能以更优惠的价格买到它。敬请关注后续更新。

相关文章

查看更多