编译:深波TechFlow
就在几天前,只有最专注的极客(我是作为其中之一说的)听说过 DeepSeek,这是一家中国人工智能公司,由同样独特的名称 High-Flyer Capital Management(该公司成立于一家公司的子公司)拥有。成立于2015年的量化分析公司。然而在过去的几天里,它可能成为硅谷最受关注的公司。
这主要得益于 DeepSeek-R1 的发布,这是一种新的大型语言模型(LLM),能够进行类似于 OpenAI 目前最好的模型 o1 的“推理”——在回答疑难问题和解决复杂问题时需要付出很大的努力。花几秒钟或几分钟通过逐步或“思维链”方法反思自己的分析。
不仅如此,DeepSeek-R1 在各种第三方基准测试(衡量 AI 回答各种主题问题的性能的测试)上的得分与 OpenAI 的 o1 一样好甚至更好,而且据报道其训练成本仅为 5 美元左右百万,并且使用的图形处理单元 (GPU) 远少于美国(OpenAI 的总部)严格禁运的数量。
但与 o1 只向付费 ChatGPT Plus 级别订阅者(每月 20 美元)和更高级别订阅者(例如每月 200 美元 Pro 级别)开放不同,DeepSeek-R1 是完全开源的模型发布的,这也解释了为什么它迅速攀升至AI代码共享社区Hugging Face上最热门、最活跃模型榜首。
而且,由于它是完全开源的,人们以各种方式对模型进行了微调和训练,以适应不同的特定任务,例如使其足够小以在移动设备上运行或与其他开源模型相结合。即使您想将其用于开发目的,DeepSeek 的 API 成本也比 OpenAI 的同等 o1 模型低 90% 以上。
最令人印象深刻的是,您甚至不需要成为软件工程师就可以使用它:DeepSeek 为美国用户提供免费网站和移动应用程序,其 R1 支持的聊天机器人界面与 OpenAI 的 ChatGPT 非常相似。然而,DeepSeek 通过将这个强大的推理模型与网络搜索连接起来,再次超越了 OpenAI——这是 OpenAI 尚未实现的(网络搜索目前仅在功能较弱的 GPT 系列模型上可用)。
明显的讽刺
考虑到 OpenAI 最初的目标是为大众实现人工智能的民主化,这里有一个相当有趣但令人不安的讽刺。正如 Nvidia 高级研究经理 Jim Fan 所说,这没有道理。但最有趣的结果往往是最有可能发生的结果。”
《偷窃并免费回馈公众》让我想起了一个英国民间故事。”
Meta陷入危机,因开源Llama而落后?
但注意到 DeepSeek 成功的不仅仅是粉丝。根据我与各种工程师、思想家和领导者的对话和阅读,DeepSeek-R1 的开源可用性、高性能以及它似乎“凭空出现”的事实挑战了生成人工智能领域的先前领导者,它在整个领域产生了冲击波硅谷及其他地区。如果不是像我的双曲线标题所暗示的那样“每个人”都为之疯狂,那么它至少是科技界和商业界的热门话题。
硅谷匿名八卦分享应用 Blind 上发布的一条消息正在疯传,暗示 Meta 因 DeepSeek 的成功而陷入危机,DeepSeek 如此迅速地超越了 Meta 自己,通过 Llama 成为开源 AI 之王模型。
“这改变了整个游戏”
X 用户 @tphuang 提出了一个令人信服的观点:“DeepSeek 已经将人工智能商品化到了最顶层之外。第一张图片让我很清楚。 R1比美国的劳动力成本便宜很多,这意味着未来5年内很多工作岗位将被自动化取代。”他后来还指出了为什么DeepSeek的R1比OpenAI的o1更能吸引用户:
“o1 有 3 个大问题:
1)太慢
2)太贵了
3)最终用户对 OpenAI 缺乏控制/过度依赖。
R1解决了所有这些问题。公司可以购买自己的 Nvidia GPU 来运行这些模型,而无需担心额外成本或 OpenAI 服务器缓慢/无响应。 ”
@tphaung 还提出了一个发人深省的类比:“DeepSeek 会成为 LLM 的 Android 吗?”
互联网企业家Arnaud Bertrand直言DeepSeek的成功对一次被误导的尝试产生了惊人的影响,如果没有这个限制,DeepSeek可能就不会出现(俗话说,需要是发明之母)。
审查制度问题
然而,一些人对 DeepSeek 的快速崛起提出警告,认为作为一家在中国运营的初创公司,它必须遵守该国的法律和内容审查要求。事实上,当我亲自在美国使用iOS版本的DeepSeek时,我发现它无法回答某些问题。
作为新闻媒体的一员,我当然非常重视言论和表达自由,这是我坚定支持的最基本的理想之一。
不过,我还必须指出,OpenAI 的模型和产品(包括 ChatGPT)也会拒绝回答一系列问题——特别是涉及人类性行为和成人/NSFW 内容的问题,即使这些问题非常常见。
当然,这并不完全是同类比较。对于一些人来说,抵制依赖外国技术可能会让他们对 DeepSeek 的最终价值和实用性持怀疑态度。但其性能和低成本是不可否认的。
在美国 16.5% 的商品从中国进口的时代,我很难仅仅基于审查制度或安全风险来警告不要使用 DeepSeek-R1——尤其是当模型代码可以免费下载、离线使用时,并且在安全环境中运行的设备上可以随意微调。
我确实注意到,围绕DeepSeek的激烈讨论中存在着一些关于“西方的衰落”和“中国的崛起”的生存危机思考。一些人将此与 TikTok 被短暂禁止时美国用户加入小红书应用程序联系起来,当时他们对共享视频中显示的中国生活质量感到惊讶。 DeepSeek-R1 的出现是在这样一种叙述背景下的:中国看起来(并且从许多指标来看确实)在崛起,而美国看起来(并且从许多指标来看确实)在衰落。
第一个但绝对不是最后一个震惊世界的中国人工智能模型
它也不会是最后一个威胁硅谷巨头主导地位的中国人工智能模型——即使他们像 OpenAI 一样,正在开发通用人工智能(AGI,或在最具经济价值的任务中超越人类的程序)筹集比以往更多的资金。
就在昨天,TikTok母公司字节跳动的另一款中国模型——Doubao-1.5-pro发布,在第三方基准测试中,其性能与OpenAI的非推理GPT-4o模型相当,但成本仅为后者的1/50 。
中国的模型发展得如此之快、如此之好,甚至连科技行业之外的人都注意到了:《经济学人》刚刚发表了一篇关于 DeepSeek 的成功和其他中国人工智能努力的文章,Politico 评论成员 Matt Bruenig 在 API 低 99.5% 上发帖 [耸肩]表情符号]”
OpenAI 如何应对?
难怪 OpenAI 联合创始人兼首席执行官 Sam Altman 今天表示,该公司将把未发布的第二代推理模型系列 o3 引入 ChatGPT,甚至免费用户也可以使用。 OpenAI 似乎仍在通过更专有和更先进的模型开辟自己的道路 - 制定行业标准。
但问题是:在 DeepSeek、字节跳动等中国人工智能公司不甘落后的情况下,OpenAI 在制作和发布新的前沿人工智能模型方面还能保持领先多久?如果真的落后了,其下滑的速度和严重程度会有多快?
不过,OpenAI 确实还有另一个历史先例可供借鉴。如果 DeepSeek 和中国的人工智能模型确实像谷歌的开源 Android 对移动世界所做的那样,在一段时间内占领了大部分市场,那么你只需要看看苹果的 iPhone 是如何通过其封闭的、专有的、该公司的策略占领了高端市场,并稳步向下扩张,尤其是在美国,目前已占据国内智能手机市场近 60% 的份额。
尽管如此,对于那些花大价钱使用领先的实验室人工智能模型的人来说,DeepSeek 表明,相同的功能可能可以用更少的钱获得,并且具有更强的控制力。在企业环境中,这可能足以获胜。