几天前鲜为人知，如今成硅谷焦点！中国AI公司DeepSeek因DeepSeek - R1大语言模型受瞩目

编译：深波TechFlow

就在几天前，只有最专注的极客（我是作为其中之一说的）听说过 DeepSeek，这是一家中国人工智能公司，由同样独特的名称 High-Flyer Capital Management（该公司成立于一家公司的子公司）拥有。成立于2015年的量化分析公司。然而在过去的几天里，它可能成为硅谷最受关注的公司。

这主要得益于 DeepSeek-R1 的发布，这是一种新的大型语言模型（LLM），能够进行类似于 OpenAI 目前最好的模型 o1 的“推理”——在回答疑难问题和解决复杂问题时需要付出很大的努力。花几秒钟或几分钟通过逐步或“思维链”方法反思自己的分析。

不仅如此，DeepSeek-R1 在各种第三方基准测试（衡量 AI 回答各种主题问题的性能的测试）上的得分与 OpenAI 的 o1 一样好甚至更好，而且据报道其训练成本仅为 5 美元左右百万，并且使用的图形处理单元 (GPU) 远少于美国（OpenAI 的总部）严格禁运的数量。

但与 o1 只向付费 ChatGPT Plus 级别订阅者（每月 20 美元）和更高级别订阅者（例如每月 200 美元 Pro 级别）开放不同，DeepSeek-R1 是完全开源的模型发布的，这也解释了为什么它迅速攀升至AI代码共享社区Hugging Face上最热门、最活跃模型榜首。

而且，由于它是完全开源的，人们以各种方式对模型进行了微调和训练，以适应不同的特定任务，例如使其足够小以在移动设备上运行或与其他开源模型相结合。即使您想将其用于开发目的，DeepSeek 的 API 成本也比 OpenAI 的同等 o1 模型低 90% 以上。

最令人印象深刻的是，您甚至不需要成为软件工程师就可以使用它：DeepSeek 为美国用户提供免费网站和移动应用程序，其 R1 支持的聊天机器人界面与 OpenAI 的 ChatGPT 非常相似。然而，DeepSeek 通过将这个强大的推理模型与网络搜索连接起来，再次超越了 OpenAI——这是 OpenAI 尚未实现的（网络搜索目前仅在功能较弱的 GPT 系列模型上可用）。

明显的讽刺

考虑到 OpenAI 最初的目标是为大众实现人工智能的民主化，这里有一个相当有趣但令人不安的讽刺。正如 Nvidia 高级研究经理 Jim Fan 所说，这没有道理。但最有趣的结果往往是最有可能发生的结果。”

《偷窃并免费回馈公众》让我想起了一个英国民间故事。”

Meta陷入危机，因开源Llama而落后？

但注意到 DeepSeek 成功的不仅仅是粉丝。根据我与各种工程师、思想家和领导者的对话和阅读，DeepSeek-R1 的开源可用性、高性能以及它似乎“凭空出现”的事实挑战了生成人工智能领域的先前领导者，它在整个领域产生了冲击波硅谷及其他地区。如果不是像我的双曲线标题所暗示的那样“每个人”都为之疯狂，那么它至少是科技界和商业界的热门话题。

硅谷匿名八卦分享应用 Blind 上发布的一条消息正在疯传，暗示 Meta 因 DeepSeek 的成功而陷入危机，DeepSeek 如此迅速地超越了 Meta 自己，通过 Llama 成为开源 AI 之王模型。

“这改变了整个游戏”

X 用户 @tphuang 提出了一个令人信服的观点：“DeepSeek 已经将人工智能商品化到了最顶层之外。第一张图片让我很清楚。 R1比美国的劳动力成本便宜很多，这意味着未来5年内很多工作岗位将被自动化取代。”他后来还指出了为什么DeepSeek的R1比OpenAI的o1更能吸引用户：

“o1 有 3 个大问题：

1）太慢

2）太贵了

3）最终用户对 OpenAI 缺乏控制/过度依赖。

R1解决了所有这些问题。公司可以购买自己的 Nvidia GPU 来运行这些模型，而无需担心额外成本或 OpenAI 服务器缓慢/无响应。 ”

@tphaung 还提出了一个发人深省的类比：“DeepSeek 会成为 LLM 的 Android 吗？”

互联网企业家Arnaud Bertrand直言DeepSeek的成功对一次被误导的尝试产生了惊人的影响，如果没有这个限制，DeepSeek可能就不会出现（俗话说，需要是发明之母）。

审查制度问题

然而，一些人对 DeepSeek 的快速崛起提出警告，认为作为一家在中国运营的初创公司，它必须遵守该国的法律和内容审查要求。事实上，当我亲自在美国使用iOS版本的DeepSeek时，我发现它无法回答某些问题。

作为新闻媒体的一员，我当然非常重视言论和表达自由，这是我坚定支持的最基本的理想之一。

不过，我还必须指出，OpenAI 的模型和产品（包括 ChatGPT）也会拒绝回答一系列问题——特别是涉及人类性行为和成人/NSFW 内容的问题，即使这些问题非常常见。

当然，这并不完全是同类比较。对于一些人来说，抵制依赖外国技术可能会让他们对 DeepSeek 的最终价值和实用性持怀疑态度。但其性能和低成本是不可否认的。

在美国 16.5% 的商品从中国进口的时代，我很难仅仅基于审查制度或安全风险来警告不要使用 DeepSeek-R1——尤其是当模型代码可以免费下载、离线使用时，并且在安全环境中运行的设备上可以随意微调。

我确实注意到，围绕DeepSeek的激烈讨论中存在着一些关于“西方的衰落”和“中国的崛起”的生存危机思考。一些人将此与 TikTok 被短暂禁止时美国用户加入小红书应用程序联系起来，当时他们对共享视频中显示的中国生活质量感到惊讶。 DeepSeek-R1 的出现是在这样一种叙述背景下的：中国看起来（并且从许多指标来看确实）在崛起，而美国看起来（并且从许多指标来看确实）在衰落。

第一个但绝对不是最后一个震惊世界的中国人工智能模型

它也不会是最后一个威胁硅谷巨头主导地位的中国人工智能模型——即使他们像 OpenAI 一样，正在开发通用人工智能（AGI，或在最具经济价值的任务中超越人类的程序）筹集比以往更多的资金。

就在昨天，TikTok母公司字节跳动的另一款中国模型——Doubao-1.5-pro发布，在第三方基准测试中，其性能与OpenAI的非推理GPT-4o模型相当，但成本仅为后者的1/50 。

中国的模型发展得如此之快、如此之好，甚至连科技行业之外的人都注意到了：《经济学人》刚刚发表了一篇关于 DeepSeek 的成功和其他中国人工智能努力的文章，Politico 评论成员 Matt Bruenig 在 API 低 99.5% 上发帖 [耸肩]表情符号]”

OpenAI 如何应对？

难怪 OpenAI 联合创始人兼首席执行官 Sam Altman 今天表示，该公司将把未发布的第二代推理模型系列 o3 引入 ChatGPT，甚至免费用户也可以使用。 OpenAI 似乎仍在通过更专有和更先进的模型开辟自己的道路 - 制定行业标准。

但问题是：在 DeepSeek、字节跳动等中国人工智能公司不甘落后的情况下，OpenAI 在制作和发布新的前沿人工智能模型方面还能保持领先多久？如果真的落后了，其下滑的速度和严重程度会有多快？

不过，OpenAI 确实还有另一个历史先例可供借鉴。如果 DeepSeek 和中国的人工智能模型确实像谷歌的开源 Android 对移动世界所做的那样，在一段时间内占领了大部分市场，那么你只需要看看苹果的 iPhone 是如何通过其封闭的、专有的、该公司的策略占领了高端市场，并稳步向下扩张，尤其是在美国，目前已占据国内智能手机市场近 60% 的份额。

尽管如此，对于那些花大价钱使用领先的实验室人工智能模型的人来说，DeepSeek 表明，相同的功能可能可以用更少的钱获得，并且具有更强的控制力。在企业环境中，这可能足以获胜。