零分Trader

DeepSeek大模型发布后如何清空云计算厂商算力库存?

作者头像
分析师熊大 本文作者

2025-2-28 阅读 158 约 12分钟读完

评论0

DeepSeek将立即返回到云计算制造商中。

“基本上,包括运营商在内的主要云制造商的云计算能力清单已被清除。”大型模型研究机构的研究人员告诉记者。调查了国内云制造商后,该机构得出了这一结论。

1月20日,在DeepSeek-R1型号发布后,各种云计算制造商推出了其全血或蒸馏版型号。它是开源且相对高效的,这进一步提高了中国人工智能的渗透率,并促进了云计算制造商以增加基础设施的投资。

“云计算能力已经被吞噬了”

DeepSeek现在是各种云计算制造商竞争的重点。

“ DeepSeek是最好的试金石。云托管服务的性能良好,吞吐量且潜伏期低,您可以直接告诉。”火山引擎总裁谭Zhiwei在他的朋友圈中说。

DeepSeek发布的模型包括多个版本,包括具有671B参数的全血版本和1.5B,7B和70B参数的小型模型。需要不同的参数,需要不同的计算资源,并且部署了不同的终端。例如,可以将1.5B型号部署在价值数千元人民币的手机上,而70B型号可以部署在价值数万元人民币的工作站上,而671B的全血式版本模型在云中更具成本效益。

火山发动机是范围内的云和人工智能服务提供商。除了支持自己的大豆袋型号外,它还推出了几个系列型号,例如月球的阴暗面和智能得分。春节刚刚结束,火山引擎推出了全尺寸的DeepSeek车型。 DeepSeek模型是开源且易于使用的。如果企业级用户想在云中使用大型模型的全血版本,则需要从云计算制造商那里购买计算能力或存储服务。

Tan Dai的声明是公司客户的声音,也针对其他云计算制造商。

DeepSeek周围的云计算制造商之间的竞争始于春节期间。为了尽快推出DeepSeek,许多工程和技术人员都度过了一个无休止的春节假期。云计算制造商之间的竞争已经很激烈,而且价格战是一场竞争。因此,连接到阿里巴巴的大型模型时,腾讯云很担心。相反,阿里巴巴云将无法完全接受Tencent的Hunyuan模型,而Baidu Smart Cloud不喜欢Tencent或Alibaba的大型模型。

开源DeepSeek看起来无害和有益于云计算制造商,因此它已获得更广泛的接受。中国的技术公司已经发布了数百个大型模型,但它们都没有像DeepSeek那样穿透,并且可以轻轻地跳到每个云上。

DeepSeek还驱动了开源浪潮。

百度曾经是封闭式路线的坚定支持者,但它还宣布将在新年后6月30日完全开放其Wenxin Mockup 4.5系列。百度智能云还连接到了DeepSeek Big Model,并吸引了开发人员以较低的价格使用它。

在2025年的Step Jump Star生态开放日,Step Jump Star是Six Six Little Tigers之一,宣布将于今年3月开放其图片生成的视频模型。以前,Jieyuexingchen发布了11种多模式模型,其中两种是开源产品。

“技能已经计划了以来AGI以来实现AGI的路线图。具体来说,有三个阶段:模拟世界,探索世界并总结世界。” Jiang Daxin, founder and CEO of Stephen Star, said: "Skills' work is carried out along these three stages. In the past year, we released a series of models, forming a comprehensive model matrix from 100 billion parameters to 100 billion parameters, from language models to multimodal models, from multimodal understanding to multimodal generation, from imitation learning to reinforcement learning, covering multiple key nodes in this roadmap."

一旦模型是开源的,它就会具有自己的活力,开源大型模型生态系统可以进一步刺激开发人员的使用热情。

中国的大型模型行业正在经历结构性转变。一些公司(例如零Oneworld)等公司放弃了高成本的一般大型模型研究和开发,并转向具有较低投资成本和更快商业效果的垂直工业模型。

在DeepSeek-R1模型引发了市场热情之后,验证了“ Jevins Paradox”的有效性。 DeepSeek指出了降低计算能力需求,但是计算功率使用效率的提高使推理模型能够迅速渗透到数千个行业中,从而推动了计算能力需求的整体增长。

“该模型的更新太快了,最佳模型必须在云上。”谭在2024年底的一次采访中说。

Oppo手机已连接到Step Stars的大型模型,而Siaohongshu已连接到DeepSeek,以增强其搜索功能。火山引擎表示,它已协助60个金融机构,包括Guosen证券,Ping证券,E基金,以访问DeepSeek Big Model。

“推理模型的发布导致了大量的玩家涌入,并且云计算能力也被吞噬了。”上述研究人员告诉记者。

与阿里巴巴云和腾讯云等领先的公司相比,具有较低和较低水平的云计算公司需要这种机会来改变收入下降。

UCID的收入在2021年达到29亿元人民币,但其收入在接下来的两年中一直在下降,2023年只有15亿元人民币。在2024年的临时报告中,UCID的收入也下降到7.3亿元,损失了1亿元。金元技术在2020年的收入为4.29亿元之后的收入也很少,2023年的收入为3.3亿元。

在对中国技术资产的这一一轮重估中,UCID和清山技术的市场价值自2025年初以来翻了一番,但现在他们也需要将绩效划分。

新的投资周期?

DeepSeek激发了中国技术巨头对云和人工智能基础设施的投资。

阿里巴巴集团首席执行官Wu Yongming于2月24日宣布,他将在未来三年内投资超过3800亿元人民币,用于云和AI硬件基础架构。这项投资超过了过去十年中阿里巴巴集团的总投资。

2月25日,百度宣布将获得YY Live,这是Huya Group的国内视频娱乐现场直播业务,约为21亿美元。达成新协议后,先前存放在托管帐户中的大约16亿美元已将其全额退回百度。 Baidu表示,它将投资16亿美元用于云和AI基础设施建设。

今年1月,苏州芬胡智能计算中心的第一阶段移动云进行了运行,第一阶段的总投资为26.8亿元。移动云的苏州项目的计划投资总额为60亿元人民币。毕竟,它可以携带24,000个机柜和500,000个服务器安装功能,最终的计算能力可以达到10eeflops。

“火山引擎的计算能力储量绝对足够,这也是我们有信心大规模地进行行业服务的重要原因之一。”谭智在2024年底对记者说。

与阿里巴巴云,百度云和其他公司相比,火山发动机是云计算市场中的后来。 “如果您想更快地做到这一点,那么您必须是新技术变化的第一个。什么是新技术变化?实际上,它是AI和大型模型,因此我们的目标是首先在该领域,我们正在朝这个方向发展。”谭泰说。

预计国内计算能力将借此机会深入人工智能生态系统。

“ DeepSeek的受欢迎程度对我们的计算能力有很大的需求。”移动云告诉了第一个金融新闻。移动云将对DeepSeek模型进行一些微调和蒸馏,以满足特定行业的公司需求。移动云提供了全国范围的部署环境。无论是本地部署还是云部署,这都会特别给中央国有的企业留下深刻的印象。

根据移动云的说法,它提供的计算能力很大程度上满足了中央国有企业的需求。 2025年2月,移动云协助中国石油完成了DeepSeek全堆栈国内生产的局部培训,适应和私有化部署,这与Ascend的计算能力支持密不可分。

Nvidia的GPU满足了90%以上云计算公司的需求,但DeepSeek的出现为国内计算能力提供了可能性。越来越多的云计算平台或终端公司接受了MU XI,Moore线程或华为Ascend GPU。

中国芯片公司还抓住了这一机会并利用了这种情况。

在启动DeepSeek系列模型之后不久,Kunlun Chip完成了完整版本的改编,并在蛇年开始建设当天宣布,它已经点燃了其新一代产品P800万张卡片群; 2月20日,Kunlun Chip正式宣布,它已在P800上实现了独立的部署全样版本。

自从DeepSeek推出“开源周”以来,它又一次开设了四个代码库。摩尔线程现在已经完成了DeepSeek开源库Flashmla和DeepGemm的改编。

美国对中国进口高端筹码施加了限制,这迫使中国公司实现技术突破。目前,NVIDIA GPU在计算功率性能和生态成熟度方面具有优势,但是随着国内芯片研究和开发的发展,算法能力的提高以及该行业对供应链安全的重视,该国希望逐步降低对Nvidia单一依赖的风险。

“这个过程需要时间和技术的积累,但这是一个不可逆转的趋势。未来的计算功率基础更有可能显示出'多维共存形式'形式,而不是某个制造商的绝对优势。”摩尔线程以前告诉记者。

上一篇 上海创业优势:海外人才招揽与配套服务助力陈建利与臧凯的创业之路 下一篇 国际黄金价格下跌至2888美元/盎司,美联储鹰派信号与地缘局势缓和影响市场
评论
更换验证码