零分Trader

DeepSeek无工作履历选人看潜力,新势力为何受关注

作者头像
分析师熊大 本文作者

2025-1-30 阅读 101 约 11分钟读完

评论0

没有工作简历,DeepSeek如何选择?答案是看到潜力。

作者:Elizaos的作者Sam Gao

0。在前面写

最近,R1连续出现的DeepSeek V3使美国AI研究人员,企业家和投资者创立了FOMO。这场盛宴甚至像2022年底出现的Chatgpt一样令人惊讶。

凭借DeepSeek R1的彻底开源(Huggingface可以免费下载该模型)和极低的价格(Openai O1的1/100),DeepSeek在美国的Apple Appstore上出现在5中。天。冠军。

那么,这支由中国定量公司孵化的神秘新AI部队在哪里?

1。Deepseek的起源

我首先听说DeepSeek仍在2021年。当时,在Dharma工作时,隔壁的Genius Girl出版了8 ACL(自然语言治疗顶级)Luo Fuli,后者离开了他的职位,并加入了幻想,离开了他的职位。高飞量。当时,每个人都非常好奇,并建立了一家非常有利可图的定量公司。我们为什么要在AI领域招募人才:幻想方面还需要发送纸张?

据我所知,当时的大多数AI研究人员招募了Fantasy Fang,正在互相战斗,并找到了一些探索的最先进的方向。其中,核心方向是大型模型(LLM)和Wensheng图模型(当时是OpenAi dall-e)。

在2022年底,幻想处方逐渐开始吸收越来越多的AI才能(主要来自北京大学大学的学生)。在Chatgpt的刺激下,在AI领域积累了多年的CEO Liang Wenfeng决心进入通用人工智能领域:“我们已经建立了一家新公司,从大型语言模型开始,然后视力。”

是的,这家公司是DeepSeek。 2023年初,这家六个小小的公司以智慧,黑暗的月球和Baichuan Intelligence代表,逐渐在舞台中间进行了舞台。在这些热门货币公司的范围内,“关注”。

因此,在2023年,作为一家纯粹的研究机构,DeepSeek(例如Li Kaifu的110万事物,Yang Zhilin的黑暗面,Wang Xioochuan的Baichuan Intelligence等),这在星星中没有发现,很难从独立地筹集资金。市场。因此,幻想党决定将DeepSeek剥离并充分资助DeepSeek的发展。在2023年的火灾烹饪时代,没有风险投资公司愿意为DeepSeek提供资金。一个是,大多数刚毕业的DeepSeek的博士学位不是很熟悉的顶级研究人员,另一个是因为资本将来退出。

在充满噪音和浮躁的环境中,DeepSeek开始在AI探索中写下其故事:

2。人才策略

早期,我遇到了一些DeepSeek的研究人员,主要研究AIGC的方向,例如2024年11月发行的Janus的作者和Dreamcraft3d的作者。其中,其中一个帮助我优化了最新的@xingchaoliu。

根据我的发现,我认识的大多数研究人员都很小,基本上是在博士生或毕业的3年之内。

其中,这些人中的大多数是北京的研究生或博士生,并且在学术方面取得了很大的成就:主要是发表3-5篇论文的研究人员。

我问DeepSeek的朋友,为什么Liang Wenfeng只招募年轻人?

他们把我变成了幻想方首席执行官Liang Wenfeng的话,原始词如下:

Deepseek团队的神秘面纱使人们感到好奇:它的秘密武器是什么?外国媒体说,这种秘密武器是“年轻的天才”,足以与财务上的美国巨人竞争。

在AI行业中,招聘经验丰富的退伍军人是常态。许多中国AI初创公司更倾向于招募具有海外博士学位的高级研究人员或才能。但是,DeepSeek反对它,他更喜欢没有工作简历的年轻人。

与DeepSeek合作的猎头曾透露,DeepSeek没有招募高级技术人员。 “工作经验是3 - 5年来最多的,而8年以上的工作基本上是通过。” Liang Wenfeng在2023年5月36日接受了36。在采访中,DeepSeek的大多数开发商都是新的毕业生,或者刚刚开始从事人工智能职业的人。他强调:“我们的大多数核心技术职位是新的毕业生或有一两年工作经验的毕业生。”

没有工作简历,DeepSeek如何选择?答案是看到潜力。

Liang Wenfeng曾经说过,做长期经验并不重要。相反,基本能力,创造力和爱更为重要。他认为,也许世界前50名中的前50名AI才能尚未在中国,但我们可以独自建立这样的人。”

这种策略使我想起了Openai的早期策略。当Openai于2015年底成立时,Sam Altman的核心想法是找到年轻而雄心勃勃的研究人员。因此,除了总统格雷格·布罗克曼(Greg Brockman)和首席科学家伊利亚·萨特克(Ilya Sutskever)外,还有四个核心。 Andrew Karpathy(Andrew Karpathy,Durk Kingma,John Schulman,Wojciech Zaremba)是新的博士毕业生,毕业于斯坦福大学,阿姆斯特丹大学,荷兰,伯克利,加利福尼亚州和纽约大学。

从左到右:Ilya Sutskever(前首席科学家),Greg Brockman(前总统),Andrej Karpathy(前技术人员),Durk Kingma(前研究人员)(前研究人员),John Schulman(前学习团队负责人)和Wojciech Zaremba (当前负责的技术人员)

这种“年轻的狼策略”使Openai的味道变得甜蜜,孵化出了GPT的岳父(相当于三名私人毕业生),Wensheng Model Dall的父亲Ramesh(NYU本科生) -e和GPT-4O的多模式负责人,三位奥运会金牌得主Prafulla Dhariwal等。在建立的早期,Openai拯救了世界计划,尚不清楚。在年轻人的水平碰撞中,一条原始的道路被养成了从深木的未知小笔触中生长出来,并成长为巨人。

正是Liang Wenfeng看到了Sam Altman的成功策略,他坚定地选择了这条路。但是,与Openai等了7年,我才看到Chatgpt。 Liang Wenfeng的投资在超过2年之后一直有效,这是中国的速度。

3。代表DeepSeek

在DeepSeek R1的文章中,它的指标很棒。但这也引发了每个人的怀疑:有两个疑问,

由于计算能力的局限性和MOE的复杂性,这使得看到只有500万美元的DeepSeek R1可疑,但是您对R1的态度是否崇拜其“低成本奇迹”还是质疑它或质疑“ hua但不是真的”,不能忽略令人眼花the乱的功能创新。

Bitmex Co -Founder Arthur Hayes发表了一篇文章,说:DeepSeek的兴起是否会导致全球投资者质疑美国的卓越表现?美国资产价值是否严重高估?

斯坦福大学的教授吴·恩达(Wu Enda)今年在达沃斯论坛上公开表示:“ DeepSeek给我留下了深刻的印象。我认为他们可以以非常经济的方式训练该模型。发布的最新推理模型非常好...非常好... “ 快点 ”! ”

A16Z的创始人马克·安德森(Marc Andreessen)说:“ DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一 - 作为开源,这是给世界深刻的礼物。”

Deepseek于2023年站在舞台的拐角处,终于在2025年的《月球日历》春季节之前站在世界顶部。

4. Argo和DeepSeek

作为Argo的技术开发人员和AIGC研究人员,我将Argo的重要特征带到了DeepSeek:作为一个工作流程系统,艰难的原始工作运行工作,Argo与DeepSeek R1进行了。此外,Argo将LLM建立为标准的DeepSeek R1,并选择放弃昂贵的OpenAI型号,因为工作流程系统通常包含大量的令牌消费和上下文信息(平均> = 10K令牌),这会导致高价。 OpenAI或Claude 3.5,工作流的执行成本非常昂贵。在Web3用户获得实际值捕获之前,这种透支是对产品的损害。

随着DeepSeek越来越好,Argo将更接近以DeepSeek代表的中国权力:包括Text2Image/Video界面的犯罪化,LLM的Sinicization。

在合作方面,Argo将邀请研究人员DeepSeek研究人员将来分享技术结果,并为AI顶级研究人员提供赠款,以了解Web3投资者和用户的AI进度。

上一篇 JellyJelly:捕捉视频聊天精彩瞬间,估值8400万上线1小时交易量3.5亿的新型应用 下一篇 美国AA5342航班坠毁事故:华盛顿国家机场附近波托马克河发生飞机坠毁,搜救工作正在进行中
评论
更换验证码