在春节期间,杭州的80年代后男孩很长一段时间以来一直在世界技术舞台上保持沉默的和平,也给全球资本市场带来了巨大的骚扰,尤其是对代表的美国股票巨头的直接影响由NVIDIA。毫无疑问,这是AI行业支持的美国股票市场的黑天鹅。尽管NVIDIA的股价在最近几天已经修复,但仍需要更多时间来观察何时可以完全修复巨大的差距和信心。对于投资而言,我们需要知道的是,这是短暂的技术影响还是技术阶段变化,具有深远的意义。
我们以前曾强调,9月24日的新政策是一种政策变化 - 巨大的货币发行,显示了顶级经济思维的变化,也表明了维持资本市场的信心,并促进了估值水平的整体恢复。新的政策放置选项可确保该指数开始在3200点左右的新中心工作,即使有任何波动,它也不会轻易打破该低点。在9.24之后,该技术行业取得了很大的增长,技术股票的估值中心急剧上升。目前,我们需要考虑的是,技术方面是否也有可能改善趋势,以及DeepSeek是否正在促进革命性和破坏性的技术变革。
主要的工程创新
如何定义DeepSeek的影响?这就需要对自学“国家财富理论”和“闹剧理论”的简单极端讨论,并从技术研究本身进行客观思考。
让我首先谈论我的结论。如今,通过更深入的研究,我对DeepSeek的最新理解仍然与我对几天前的文章“ Is DeepSeek A Rise a a Miracle”的看法保持一致。尽管不能说DeepSeek是一场伟大的技术革命,但它确实是一项里程碑工程创新,也是对中国工程师的文化核心优势的完美反映。
我们可以将技术革命分为两个过程:科学革命和工业革命。人工智能也是如此。人工智能已于1960年代正式开始。如果我们从图灵的相关概念提出的提议中计算出来,那将是较早的。真正使每个人都知道的是微软的Alphago。与GPT类似,他们都采用了加强学习(RL)方法,并通过许多实际互动与专家战斗的过程进行学习。 Alphago的伟大是,它并不完全基于过去的预训练,而是依赖于不断学习和增强的记忆能力,并且是人工智能革命中重要的技术里程碑。
汽车不是由中国发明的,但如今,中国是最大的汽车生产商,而新能源车的核心技术并未由中国发明。但是,中国目前的新能源车可以席卷世界。欧洲中世纪的圣经的复制非常昂贵,在将中国可移动的印刷介绍给欧洲后,这使圣经非常便宜且迅速受欢迎,从而使每个人都可以阅读。知识不再被垄断,并突出了人类价值,这直接导致了欧洲的一系列变化,例如宗教革命,科学革命和文学启蒙,这是所谓的启蒙运动。真正使美国人负担得起汽车的原因是福特装配线,它优化流程并降低成本。发明汽车的科学家还是使每个人都驾驶汽车出色的工程师的科学家?
人工智能也是如此。没有DeepSeek的出现,我们将与大规模模型应用程序的普及相去甚远。许多海外公司,包括硅谷工程师,甚至是传统的不友好的海外媒体,对DeepSeek有很高的赞誉,有些甚至称赞它。可以说,这是一种主要的工程转型,甚至可以被视为人工智能领域的工业革命。
查看DeepSeek兴起的AI的发展趋势
2017年,Google推出了专门从事机器翻译的建筑模型。它引入了一种自我发挥的机制,该机制可以更有效地捕获序列数据中的长距离依赖性,并支持并行计算,从而大大提高了训练和推理的速度。 ,这是变压器体系结构。依靠这一有利的功能,变压器迅速扩展到自然语言处理的其他领域,并逐渐成为大型语言模型处理的主流体系结构,从本质上促进了生成人工智能的发展。
人工智能的本质是数学和物理学的应用,这是根据物理革命(例如权力革命和芯片革命)逐渐实现的。该模型的工作原理并不困难,它是一个非常典型的数学应用问题,主要使用三种数学理论,即线性代数,统计和计算。首先,线性代数用于将文本转换为数字向量,然后使用语言统计来形成一串数字代码并执行回归操作。人工智能利用空间的广度来通过大规模的数据操作实现无限的可能性。如果时间足够长并且空间足够大,则可以进化各种计算结果。
硅谷的数学家和物理学家是一群带领这项技术革命的理想知识精英。但是,他们通常会忽略工程问题,例如如何节省成本和提高效率。 DeepSeek的伟大之处在于它使用FP8,即8位二进制值的浮点计算能力,以解决FP32计算能力国外可以实现的工作,使硅谷的骄傲精英模型突然变得“ Pinduoduo”。使AI负担得起更多的公众。但是,鉴于正在追求星星和海洋的硅谷科学家,使用FP8是一种回归,与先进的FP32浮点格式相比,即使FP8可以显着降低成本。 DeepSeek对培训和推理目的进行了主要的工程优化,尤其是蒸馏技术的应用。
硅谷科学家通常专注于尖端技术的发展。在您需要金钱和筹码的有利环境中,您可以很容易地忽略成本问题。但是,高端芯片很昂贵,培训大型型号的成本很大,因此很难参加普通人。这种差异化导致了越来越高的技术阈值,只有少数人可以领导技术的发展。此外,随着历史可用数据的不断消费和培训成本的增加,模型的前训练效果很难不断改进,并且训练前的时代也可能结束。因此,一些公司已经开始探索新的培训方法,例如增强学习和监督微调,以减少对预培训的依赖,从而提高模型效率,同时降低成本。一些公司还使用混合专家模型和多头注意机制来进一步优化推理过程。这样,该模型只能在推理时调用必要的参数,从而节省大量计算能力。新技术的应用可能会带来新的工业革命,并促进全球技术生态系统的发展。
我认为这场技术革命不仅会改变技术行业,而且还将对整个社会产生深远的影响。成本的降低可能会使更多的人使用这些技术,从而促进工业制造能力的提高和人类认知平等的发展。同时,这也可能引起一系列社会和经济问题,我们需要密切关注。
最后,我想给您另一个提醒,想一想,DeepSeek触发的大型模型工程创新是否会自9/24以来从“ Money Bull”到“技术公牛”,类似于“ Money Bull”,类似2022年,Chatgpt之后的美国股票市场于2019年11月出生。当然,美国股票市场的“技术公牛”中有70%依赖于七个巨人。中国的“技术公牛”支持七个巨人?我保持一定程度的乐观情绪。
(作者是Xijing Research Institute的主席,也是中国首席经济学家论坛的成员)
第一个财务日报被授权从微信公共帐户“首席经济学家论坛”中转载。