零分Trader

DeepSeek大模型技术冲击市场,如何改变C端应用排行与竞争格局?

作者头像
分析师熊大 本文作者

2025-2-26 阅读 210 约 18分钟读完

评论0

大型模型行业中气象叶片的快速旋转有时是出乎意料的。在去年最受欢迎的C-End大型模型应用程序的国内制造商中,Doubao和Kimi必须是其中的制造商。但是,如果您最近查看中国苹果的免费版本应用程序的排名,您会发现第一名是DeepSeek。在配备了DeepSeek并慷慨投资之后,Tencent Yuanbao也排名第二。

DeepSeek“概念”是否已成为C端大规模模型最近流行的重要因素。这样的公司在公众眼中很少见,它不仅改变了应用程序的排名,而且还影响了大型模型的竞争格局。

接受采访的几位AI行业内部人士说,DeepSeek的技术实力很强,其选择的开源选择对一些封闭的资源公司产生了影响,并且一些大规模的模型团队需要反思自己的实践。但是,DeepSeek的某些特征,例如不依靠外部融资,几乎只是进行基础研究,很难由其他团队复制。一些行业内部人士一直在冷静地评估和思考如何向同伴学习。

“ DeepSeek的一些作品为每个人提供了巨大的灵感。例如,如果您专注于非常准确的方向,那么您将很容易获得一些东西。” Weibian Intelligent首席执行官Li Dahai告诉第一名财务记者。但是他还提到,我们应该在客观和理性上研究DeepSeek的成功。如果公司完全学习了DeepSeek的方法,则不一定意味着它将取得下一个成功。

重新评估DeepSeek

2月26日,DeepSeek按承诺开设了第三个代码基础,并且将在接下来的几天内继续开源两个代码库。开源有利于该行业。来自国内大型模型制造商的大型模型研究员Acedar告诉记者,DeepSeek的创新成就非常实用,其他大型模型团队可以直接使用它们,这将全面提高国内大型模型的水平。

在提高大型模型的整体水平时,该行业的DeepSeek更像是一个破坏者,使其他大型制造商感到有些尴尬。除了技术巨头外,去年,六家大型初创公司仍在中国的聚光灯下。他们的估值可能超过200亿元人民币。 DeepSeek没有出现在融资战争中,几乎没有营销行动,有些甚至被掩盖了。这是一家突然掩盖了“六个小龙”的公司,并将新变量带入了行业竞争。

如何评估这样的竞争对手? DeepSeek在技术水平方面是否完全超过其他制造商?除了赞赏外,该行业最近也有一些不同的声音,认为开源的影响不能抛在一边,并且从技术优势的角度看,DeepSeek的流行也无法观察。一种观点是,DeepSeek-R1的推出更像是Llama是开源的那一刻,而不是发射Chatgpt的那一刻。 R1的受欢迎程度在很大程度上基于OpenAI封闭源充电的错误策略。

“如果R1是封闭的源模型,它绝对不会达到当前的'开箱即用'效果。”福丹大学计算机科学技术学院教授Qiu Xipeng在在线直播中说。 “ R1之所以担心它是低成本,第二,良好的效果和第三个开源的原因。梅塔模型开源的原因不如DeepSeek强大,因为它的效果不如R1。 R1 Big Model位于阵列中的Head大型模型,其他型号是封闭的来源,在这种情况下,R1将对所有大型公司产生巨大影响。” Sina Weibo的新技术研发负责人Zhang Junlin也告诉记者。

Li Dahai向记者分析了DeepSeek成功的方法既是不可避免又偶然的。必然性在于openai O1模型的高阶推理效果的再现,并且该模型是开源的。同时,DeepSeek的增长率非常快,这也与发射时间点有关。在春节,中国社交聚会的高峰,沟通效应比平常更高。

从技术困难来看,一些行业内部人士还分析了DeepSeek可以在短时间内重现O1的水平,这本身具有一定的可预测性。 DeepSeek-R1不是纯粹的基本模型,而是基于DeepSeek-V3。一位领先的国内大型模型制造商的研究和开发工作者告诉记者,R1的性能在短时间内赶上O1的幕后,O1的技术障碍相对较小,在探索了算法解决方案之后,R&D变得简单。相比之下,GPT-4基本模型的再现具有更多的影响因素,例如计算功率部署,数据准备,工程基础架构等是必不可少的。在制作R1之前,DeepSeek的基本模型已经可用,并且已经准备好各种基础架构,这是可以快速启动R1的重要原因。

张·朱林(Zhang Junlin)甚至认为,制作R1并不需要太多时间,R1的成本估计仅为100,000美元甚至更低。相比之下,如果GPT-4的纯基本模型的复制品,大型模型团队最多可以花费2个月才能更改算法并消耗多达数千万元的元。 “ R1主要使用非常主流技术,这意味着,即使大型团队耗尽各种主流技术,他们最终可以尝试正确的路线,并且一次尝试的时间和金钱成本也不高。”张朱林相信。

在认识DeepSeek团队的技术能力的同时,一些AI从业人员最近还分析了R1的缺点。 Qiu Xipeng认为,R1仍然存在过度优化的问题,例如经常使用一些非常高端的词汇,R1对一般任务的推理效果并不理想,背后是强化学习的概括需要进一步研究。

记者了解到,在DeepSeek引发了AI浪潮之后,一家国内互联网公司最近进行了内部讨论,以探索DeepSeek等AI技术的实际使用。一名员工在会议上提到了DeepSeek-R1的优势和缺点,称R1适用于需要推理和思考逻辑的财务,医疗保健和教育等场景,但不适合执行本地处理的场景。例如,让DeepSeek编写一个函数。在没有上下文理解的情况下,使用具有非本性思维路径的大型模型更好。

DeepSeek还专注于应用程序方案,这意味着DeepSeek模型不一定适合所有方案。一家芯片制造商的高管告诉记者,R1-671B是一个很大的典范。该公司计算出,将至少64台机器全部部署R1并允许R1理解180k上下文。在机器大量部署和高系统成本的情况下,单个用户的令牌成本可能非常低,并且并行用户的数量可能非常大。他认为,DeepSeek的未来业务战略将针对C方案,而不是B或私有化部署。

DeepSeek的创新工作不能被其他大型模型公司采用。 Li Dahai告诉记者,在R1发布之前,Shimbian的智能关注,并了解了DeepSeek的许多工作和技术思想。但是,DeepSeek的工作主要针对云中的高并发情景,而面向墙壁的智能则集中在终端方案上,并为单个用户的独家模型提供服务。在末端方案中需要解决的主要问题是,功耗足够低,并且响应足够快,这与云方案大不相同。许多DeepSeek设计思想无法直接使用。

余额向开源倾斜

DeepSeek-R1并不是大型模型竞赛的终结。 OpenAI的下一代推理模型O3计划被整合到GPT-5中,并在几个月内推出。马斯克的AI公司Xai还向Openai和DeepSeek挑战。 DeepSeek是否可以赢得下一场比赛仍然可变。但是可以肯定的是,它对行业竞争产生了更深远的影响,导致开放和封闭的来源的平衡开始向开源方倾斜。

Openai首席执行官Altman表示,在2月O3-Mini发布的那天,Openai的开源政策正处于“历史错误”上,需要提出不同的开源战略。一些行业内部人士分析了Openai的“傲慢罪”在于隐藏O1的思维过程并采用高成本模式,这种模式无法使尽可能多的人感到深思熟虑。

在该国,始终坚持封闭的源路线的百度也“转过身”开了开源。去年,百度董事长罗宾·李(Robin Li)还说,大型模型的开源不是很有意义,并且封闭的源模型将继续领导能力。今年2月14日,百度宣布将在接下来的几个月内推出Wenxin Mockup 4.5系列,并将于6月30日正式开放。

从开源的影响来看,封闭的源模型(不如开源模型)面临令人尴尬的情况。由于开源模型可以通过开发人员私下下载,微调甚至私人部署,因此使用封闭的源模型无需付费。

从商业角度来看,一些从业者认为DeepSeek证明了当前开源的正确性。

“从业务角度来看,在模型行业中,如果将技术用作使业务做得好的引擎,并且该业务具有完整的闭环业务模型,那么该引擎可能不一定需要开源。例如,Google搜索引擎作为内源引擎,字节推荐系统不需要开源。可以用很多钱从这种逻辑中赚钱,越来越多的人选择关闭来源。

李·达伊(Li Dahai)告诉记者,实际情况是该行业在此阶段已经“填充”了一年,但没有看到基于大型模型的超级应用程序很快就会出现的可能性。没有非常适合封闭源模型的业务模型。在模式下进入开源路线可能更正确。从另一个角度来看,在AGI(通用人工智能)轨道中,模型能力的演变目前是最重要的任务。让模型成为更快吸引注意力并通过绝对改善模型智能的核心技术,并提高行业意识。生态系统是更大的好处。开源可以使最重要的工作更快地感知和接受。 “这次,DeepSeek的成功使更多的球队在中国意识到了我提到的逻辑。”

李·达伊(Li Dahai)告诉记者,开源逐渐成为范式,这可以使整个生态系统的参与者都具有信任。这种信任来自两个方面:一个不必担心它是纯公关(营销促销),而另一个不必担心这支球队。是否可以在将来生存,即使公司消失了,我们仍然可以根据开源生态系统迈出下一步。在商业化方面,许多开源模型也可以通过API(接口)赚钱。即使是由于开源带来的信任,直接使用该模型赚钱也可以带来更大的收益。

与大型制造商的构建应用程序的方式相比,从大型模型的智能演变的角度来看,一些从业人员认为,追求当前的模型智能水平更为重要。张朱林说,只要基本模型的智能水平得到改善,许多应用程序的障碍就会变得越来越薄。一种可能性是,当基本模型的智能增加时,只能使用来自某个字段的少量数据来完成字段中的任务。 ,那么,大型模型制造商应尽快申请并形成数据障碍的逻辑无效。

除了DeepSeek外,Li Dahai告诉记者,面向墙的公司的核心也完全包含开源。一些制造商还报告了有关开源的新闻。奥特曼(Altman)最近在社交平台上提出了两个开源模型的指导,并进行了投票调查。阿里巴巴在2月25日晚上开设了视频生成模型Wanxian 2.1。

未确定模式

可以看出,DeepSeek增加了AI的渗透。在基米(Kimi)的黑暗面暂停了“燃烧的钱”投资之后,熟悉此事的人们回答说,原因是,深层繁荣吸引了公众对AI的认识,以及包括Kimi在内的几种主要产品的自然增长,增加了一倍。 “由于Deepseek,我们已经看到许多仍在犹豫的行业开始更加积极地拥抱AI。许多客户找到了我们,这是该行业的双赢局面。” Li Dahai告诉记者。

更难看到的是,索引有多改变行业中其他公司的状况。去年犹豫是否投资大型模型的投资者告诉记者,投资大型制造商的风险在于高估和不确定性,人们可以出现。但是目前,随着DeepSeek的使用越来越多,DeepSeek的确定性得到了增强。他认为,大型模型行业将具有互联网获奖者的特征,甚至将来可能只有一种基本模型。 DeepSeek和开源实践的出现使大型模型行业变得清晰。卡变得更快。

Li Dahai认为AI仍在迅速发展,而AGI是一个相对深远的目标。 “ AGI赛道的比赛是长途奔跑和马拉松比赛。现在我只跑了一段时间,可能是5公里或10公里,所以每个人都在将来仍然有机会。”李·达海(Li Dahai)说,在此过程中,团队的人才密度和未来技术的愿景是一个非常重要的特征。

最近是否可以复制DeepSeek的成功也是一个热门话题。作为一家不依赖外部融资的公司,主要专注于基础研究,并且不急于商业化,DeepSeek具有与其他公司不同的足够特征。一些分析师认为,基于资本所有权的技术理想主义是DeepSeek成功的重要原因,而其他公司也很难拥有此功能。是否尝试复制DeepSeek已成为其他制造商面临的问题。

Tsinghua University的长期副教授Liu Zhiyuan在网上分享中说,我们可以感觉到DeepSeek具有技术长期主义引入的结构。 “中国已经达到了这样一个阶段,需要更多的团队,例如DeepSeek,但它并不是诸如DeepSeek这样的丰富,他们可以稳步进行一些创新吗?这值得我们考虑。”

基于现实,阿克达尔(Acedar)告诉记者,DeepSeek的目的是研究,并且不关心短期回报,而其他初创公司和大型技术公司则面临各种关系。尽管DeepSeek的模型产生了影响,但仍有一个疑问,该行业中有多少团队将他们付诸实践。

“每个公司都有每个公司的捐赠,并且不同的领域在不同领域都有问题。如果您完全学习DeepSeek的方法,就不必成功。这是对剑的搜索。”李·达伊(Li Dahai)认为,基础研究和商业应用的优先级是优先的。在顶部,面对墙壁的答案是基本模型,但墙壁的脸可能与DeepSeek完全相同。 “我们认为商业应用程序也非常重要,因为端端更接近用户。我们应该使用商业实施来将基本模型演化的实际有效性同步到用户。我们必须掌握这两个端方大型模型。”

“回顾历史上的创新​​,他们的模型不同。他们本质上解决了重点领域的一些复杂而限制性的问题。” Li Dahai告诉记者,DeepSeek拥有良好的现金流量,并且可以不断补贴大量资金。当然,模型团队是一个相对理想的状态。研究人员可以专注于科学研究,但是当有更大的限制并且需要更少的钱来做事时,限制也可能会刺激意外的创新。 DeepSeek的创新来自矛盾,也就是说,该模型必须很聪明,而且不太昂贵。 “大型模型面对墙壁,终端也必须面对许多矛盾,例如使模型变得聪明,功耗很低,限制可能会刺激创新,我们认为您不必拥有很多像DeepSeek一样,您可以自己的钱进行此类创新。”

上一篇 万向信托19号推出打折兑付方案,贵州城投项目隐债化解新进展 下一篇 信用+交通:2024年信用交通典型案例揭示信用如何重塑出行体验与行业生态
评论
更换验证码