在用V3和R1型号扫荡硅谷并引爆了全球技术圈之后,DeepSeek继续扩大了除夕的窍门。
在1月28日清晨,人工智能社区拥抱面孔显示,DeepSeek发布了开源的多模型Janus-Pro,与以前的语言和推理模型相比,具有10亿和70亿个参数,新的模型发布了。这次以Wensheng的能力为重点。
根据DeepSeek的技术文档,该模型允许AI读取图片和AI。在Wenshengtu Geneval和DP基础参考测试中,与上一代Janus相比,Janus-Pro-7b的准确性大大提高。准确性测试结果分别为80%和84.2%,高于稳定的扩散其他对比模型。
“他们真的很想成为下一个格罗克(他们真的想成为下一个grok)。”海外网民说,对于DeepSeek的最新版本。早些时候,由马斯克(Musk)创立的XAI发布了一系列名为Grok的模型和应用,这被认为是对OpenAi等行业巨头的直接挑战。
DeepSeek的AI Raw绘图和绘图的能力是什么?
在外部网络上,一些网络测试了读取图片的能力,称Janus-Pro-7b的高精度阅读能力非常好。它发布的屏幕截图表明,乳胶代码复杂数学表达式的混合型图片以及测试时间订单图中的手绘样式,《美人鱼代码的测试》都实现了阅读图通过一句话。
上面提到的网民表示,尽管代码上的模型在更强的时间内,但序列的数字无法一一刻上原始地图,但存在一些错误,但是基于经验判断,您可以解决本质
就Wensheng的能力而言,一些网络也首次测试了,然后是屏幕上的美学和指令,以查看Janus-Pro接近当前的头部模型级别。
根据技术文档,Janus-Pro-7b在文本到图像指令跟踪排名中得分0.80,优于Janus(0.61),DALL-E 3(0.67)和稳定的扩散3介质(0.74)。此外,Janus-Pro在DPG基座上得分为84.19,超过了所有其他方法。这表明Janus-Pro擅长遵循密集的说明,以生成图像的文本。
DeepSeek还向外界展示了一些Wenshengtu案例,这些案例在屏幕质量方面表现良好。
DeepSeek的热量仍在继续。 1月27日,DeepSeek应用在Apple China和美国应用程序商店的免费应用程序下载排名高位,在美国下载列表中超过了Chatgpt。该记录持续到1月28日。截至发稿时,DeepSeek仍然在列表中统治了美国Apple App Store,并在免费列表中保持了第一名。
从去年年底到今年年初,DeepSeek又一次发行了重型产品,关注不断积累。
DeepSeek Out the Circle是在12月26日。当时,新系列模型DeepSeek-V3的正式宣布同时推出并开了开源。然后它刷了海外社交媒体平台X。头部模型,但培训预算非常低。 GPU幅度训练集群训练。
当时,聊天机器人竞技场数据显示,DeepSeek-V3在所有模型中排名第七,在开源模型中排名第一。这是世界十大前十名。
“ Llama 3 405b使用了3080万个GPU小时,而DeepSeek-V3看起来像是一个更强大的型号,仅使用280万个GPU小时(大约是计算量的十分之一)。”特斯拉AI团队的负责人安德烈·卡尔帕蒂(Andrej Karpathy)在X上发布,如果可以广泛验证该模型的出色性能,则该模型将在研究和工程方面令人印象深刻。
就在1月20日,DeepSeek正式开放了其推理Model R1的来源。 1月24日,DeepSeek-R1在聊天机器人竞技场综合列表中排名第三,并与OpenAI的首要理由模型相关。在高度难度提醒单词,代码和数学等高科技领域中,DeepSeek-R1被吸引了;在测试样式控制和难度提醒和样式控制的测试中,DeepSeek-R1与O1并列。
DeepSeek基于“低成本培训”和“成本效益”作为其核心卖点。 API输入价格仅为每百万代币0.1元,远低于当前行业的头型模型,例如Claude 3.5十四行诗3/百万美元的代币,这种低成本的培训策略还为公司赋予了“ AI战斗”的标题。 Duoduo”。
市场认为,DeepSeek的成功可能会削弱市场对NVIDIA AI芯片的期望。许多经纪公司已发布了研究报告的应用,即大型AI模型的应用将逐渐成为包容性。趋势曾经触发了硬件制造商(例如Nvidia)的股价。
截至周一结束时,NVIDIA收于16.97%,市场价值蒸发近5900亿美元,以刷新美国的财务历史记录。在周一之前,美国股票历史上最大的单日市场价值蒸发记录是Nvidia于去年9月创造的2790亿美元,然后元元在2022年下跌了2320亿美元。
此外,Broadcom的股价也下降了17%以上,TSMC下降了13%以上,Arm Holdings是软银的子公司,下跌超过10%,AMD下降了6%以上,而Asmore下降了5%以上。
1月27日,当地时间,美国总统特朗普在佛罗里达州迈阿密发表演讲,说DeepSeek的模型对中国人工智能创业公司DeepSeek具有有效且经济。它还“对美国相关行业感到惊讶”,并且美国“需要专注于赢得比赛”。