零分Trader

DeepSeek 2025年春节焦点:技术创新与AI行业影响深度解析

作者头像
分析师熊大 本文作者

2025-2-12 阅读 112 约 2分钟读完

评论0

毫无疑问,DeepSeek是2025年春节的重点。从应用程序到苹果商店的免费列表,再到急于部署DeepSeek-R1的各种云制造商,DeepSeek甚至成为许多人体验的第一个AI产品。对于企业家来说,每个人都在谈论对技术创新点的讨论,培训分析和推理成本对整个AI行业的影响。

2月2日,吉克公园(Geek Park)领导下的全球闭门社区的创始人公园和Global Ready组织了封闭式讨论,邀请了60多家在中国硅谷,中国,伦敦,新加坡,日本和其他地方的AI公司创始人的创始人。人们和技术专家从DeepSeek触发的新技术方向和产品趋势进行了深入的讨论,从技术创新,产品实施和计算能力短缺的角度触发。

脱敏处理后,我们列出了这次闭门讨论的关键点。

01 DeepSeek的创新在哪里?

DeepSeek于12月底发布了V3码头模型,这是该行业目前最强大的模型之一。它包含37B激活参数,总参数量表为671b。它是一个大型萌(混合专家)模型。

R1模型于2025年1月发布的“ AHA时刻”是指反映模型执行推理的能力。例如,在解决问题过程中,该模型可能会意识到一种方法不再适用并适用于该过程中更有效的方法。这种反思能力来自增强学习(RL)。

R1是DeepSeek的旗舰模型。就推理能力而言,R1等同于OpenAI O1。特定的实现方法可以概括为:R1使用两步增强学习和两步SFT。前两个步骤中的RL和SFT主要用于构建数据生成。教师模型指导数据生成的第三步。该模型致力于目前成为最强大的推论模型。

02为什么DeepSeek这么低? 03聊天机器人可能不是用户的第一个AI产品。 04垂直场景AI更容易实现。预计05个国内芯片将解决推理计算能力问题。 06更强大的代理和跨应用程序调用功能

上一篇 加密领域的信任危机与柠檬问题:社会共识与自我监管的重要性 下一篇 古茗控股港交所上市首日表现及IPO基石投资者详情分析
评论
更换验证码