2025年初,DeepSeek在国内外大型模型行业造成了地震。除了在回答问题中深层推理模型DeepSeek-R1的出色表现外,DeepSeek的存在还将紧张局势和新鲜空气注入了国内大型模型圈。
首先,凭借其技术优势,DeepSeek在一个Fell Swoop中进入了国际大型模型的顶级梯队,这使国内大型模型公司有可能超越曲线。
其次,DeepSeek的训练结果打破了有限的计算能力问题,并证明通过算法优化,高质量模型也可以通过低计算能力进行训练。
当将计算能力的“瓶颈”隐藏的担忧抛在一边时,应考虑到能源消耗和准确性的大型模型应解决哪些问题?在这个层面上,国内大型模型公司已经提供了自己的答案。
最近,由中国科学院自动化研究所孵化的AI公司Yayi-Ultra发行了Yayi Big Model的旗舰版Yayi-Ultra,该版本由AI Company Zhongke Wenge发行,该公司是由中国科学院自动化研究所孵化,在破解大型模型的“精确能量消耗”的困境之前,给出了自己的答案。
作为一个涵盖全球100多个模型的权威评估系统,OpenCompass列表一直是观察大型技术途径的“气压计”。在最近发布的Opencompass大型模型公共学术榜上,中国Yayi-Ultra(64.5分)首次进入前十名,并成为前十名中的五个中国大型模型之一。
在Opencompass大语言模型的最新开放实时列表中,Yayi-Ultra排名全面的分数为64.5,排名第十,其中:
代码生成:LiveCodeBench排名第五,表现优于GPT-4O-20241120版本
复杂的指导理解:Ifeval排名第九
知识推理能力:MMLU-PRO排名第九
在侧重于中国理解的C-eval评估中,Yayi-Ultra在公共访问列表中排名第二,允许自主验证,并在中国情景中证明了其技术优势。
第一手测试:超长文本输出
准确掌握复杂的任务计划
根据官方信息,Yayi-Ultra在图表理解,复杂的任务,长期理解和产生方面具有出色的表现。我们立即开始使用六个维度(多模式图表深度理解,复杂的图像理解和复杂的任务智能计划(功能调用),数据的统计分析以及超长的文本理解和生成)。
01视觉理解升级:了解语言并更好地理解图表
让我们先阅读图表。
提示:大约在2000年,哪个价格范围更改了财产费用最大的比例?
Yayi-Ultra可以准确地识别条形图中的不同颜色和数字,充分理解图表并给出答案。
除了中文方案外,在多语言方案中,Yayi-Ultra还可以准确理解并遵循用户说明,以提供准确的跨语言答复。
提示:20122年至2022年之间,与农业相关的就业的分布如何变化?它是否增加或减少,以及以多少百分比或数量?中文回答。
可以看出,从视觉理解的角度来看,Yayi-Ultra已完全升级以解决技术困难,例如跨语言多模式对齐,多刻图推理和可变分辨率,这增强了模型的跨语言图表的理解,多画的问题和答案以及多模式。遵循状态指示和其他方面的能力不仅可以轻松地应对复杂的图表方案,例如堆叠的条形图,散点图和混合图表,而且在图表重新划分和图表转换之类的任务中也出色。
02智能解释形式:成千上万的形式没问题
在工作中,复杂的报告既耗时又费力。我们将yayi-ultra“加热”一张桌子,在三种类型之间交替:行业普通报告,行业深入的报告和公司普通报告。 Yayi-Ultra准确地计算了不同类型的报告。数字。
提示:每个报告类型的数量是多少?
在不规则表方面,Yayi-Ultra仍然可以准确解析并提取关键数据。下表包含总分结构和复杂的数据语句。 Yayi-Ultra可以准确地了解表中的模型类型,方法和局部指标的变化,并完成比较分析。
提示:使用IKE方法后,哪种基座模型的本地化最大减少?
从统计数据理解方面,可以看出,Yayi-Ultra着重于增强对桌面问题和答案中复杂的排版和跨语言问题和答案的理解。
从财务报告,学术论文到包含嵌套结构的复杂表,Yayi-Ultra可以准确地找到信息并了解用户意图;同时,该模型还可以在跨语言表的问题和答案方案中提供有效而清晰的答案。
03功能调用:复杂任务的智能计划
为了继续遇到困难,让Yayi-Ultra在去年的奥运会上画出了中国球队的黄金,白银和铜牌数量(随着时间的变化)。
首先,我们可以看到Yayi-Ultra准确地理解了用户的意图,确定“最后的奥运会”是指巴黎奥运会,并制定了详细的任务计划。接下来,该模型通过搜索引擎在巴黎奥运会上获得了中国球队的黄金,银色和铜牌。相关数据(包括获得91枚奖牌的类型和时间);然后对这些奖牌数据进行排序,对其进行整理,按时对其进行排序,并生成代码,并通过调用代码解释器来完成列表图。
Yayi-Ultra能够完成这一系列复杂任务的原因与提高的工具调用能力是不可分离的,它主要包括搜索引擎,代码口译员,图像分析,天气和其他基本工具;新闻热列表跟踪,沟通影响分析和其他特殊的垂直现场工具。
该模型可显着增强多工具串行呼叫场景中的计划合理性,同时提高了复杂搜索场景中的信息收集能力。
04多模式输出:图片和文本,直觉和简洁
在文献阅读或信息收集过程中,我们通常需要搜索和分析来自多个文档(例如数值更改,实验结果等)的特定信息。现在,我们可以在一个句子中找到所需的内容,Yayi-Ultra正在基于描述中的文本分析,可以同步相应的图片内容。
例如,询问:不同协作策略下不同行为的百分比
根据这个问题,Yayi-Ultra确定了用户构建的“人工智能纸知识基础”的多个相关的AI论文,并基于此构建了答案。答案中不仅有文本,而且在相应的引文位置也给出了原始图片,从而大大提高了阅读体验和答案的可靠性。
05完整的堆栈长文章:我会写几个单词,像神一样写作
最引人注目的是超长文本的输出。 Yayi-ultra最多支持200,000个输入单词和100,000个超长输出单词,形成了从“输入理解”到“内容创建”的完整链接长文本功能的闭环。
yayi-ultra支持网络智能创建和文档锚定创建的双重模式,并将长文本写作任务分解为较小,更可控制的子任务(制作课程提纲,然后基于课程提纲),这些子任务有效地生成了全文)确保文字。提高长篇文章质量的结构。
●互联网连接的智能创建:互联网连接的信息以完成创建
提示:撰写一份30,000个字的历史分析报告,内容涉及中国儒家文化具有中国特征的发展
●文学锚定创建:划定知识的界限并准确写作
提示:请根据参考材料撰写一篇长文章,主题是“通用人工智能解决方案:创新和效率的完美结合”
06数据分析:准确的解决方案,视觉互动
最后,我们还对基本数据分析和视觉图表绘图进行了实际测量,Yayi-Ultra准确地完成了分析,计算和图表绘制任务。
提示:根据表,计算人均每月收入,然后计算每月收入和人均每月收入之间的差异,绘制列图,水平轴为名称,垂直轴是差异,并且标题是“人均收入和平均值之间的差距”。
根据用户要求,Yayi-Ultra生成Python代码并通过Thought(Pot)功能来执行该代码,准确地完成了数值密集型任务,例如统计推断,矩阵操作和数值优化。
从“洪水”到“精确匹配” yayi-ultra使用灵活的专家配置来突破大型模型着陆的瓶颈
目前,AI模型的实现正面临着“容量成本”剪刀间隙扩大的关键节点。
根据最新的IDC报告,公司面临的问题是,在实施AI大型模型期间,模型的准确性无法完全满足业务需求;同时,有92%的公司认为,缺乏计算能力资源是大型工程实施阶段的最大挑战。
中国的Wenge Yayi技术团队透露,Yayi-Ultra是具有多场功能的混合专家模型。为了提高不同领域的专业任务的绩效,它采用灵活的专家配置模型来支持数学,代码,财务和公共情绪。传统中医和安全等各个领域的专家可以大大减轻垂直领域密集模型迁移中常见的“ seesaw”现象,并且可以为行业提供“高精度,低能消耗”的智能解决方案根据不同领域的需求。计划。
例如,在媒体领域,宗克·韦格(Zhongke Wenge)根据Yayi功能推出了Hongqi 3.0 Integrated Media Intelligent Platform 。在自动审核功能之后,某个客户正在引入,内容错误率已从5%下降到0.5%左右,并且已在诸如新华社,CCTV和中国日报等领先媒体中广泛使用。
Zhongke Wenge Hongqi 3.0集成媒体智能平台
在医疗领域,基于Yayi的大型医疗中医模型可以准确诊断500多种常见疾病,为患者提供个性化的治疗计划,以及临床专家的评估,诊断和推理的准确率高达90 %。在中医资格检查中,它在模拟测试中表现良好,准确率超过94%。它还为C-End用户推出了“ Dayi Jinkui”传统中医健康管理应用程序。
中国传统中药与中国科学学院Wenge Dayi Jinkui传统中医健康管理应用程序
在金融和税收领域,基于Yayi的财政和税收知识模型具有特殊的评估,模型答案的准确性为90.1%,比其他类似模型高。访问大型模型后,客户可以实现24小时不间断的咨询服务,减少用户的需求约为50%,并且用户满意度提高了30%以上。
航空航天信息和宗克·韦格(Zhongke Wenge)共同开发了大型的财务和税收知识模型
目前,Yayi-Ultra(Yayi.wenge.com)已在官方网站上开放数据分析,知识库文献分析和超长写作功能。有兴趣的朋友还可以登录尝试。