零分Trader

全球高校AI研究面临算力困境:GPU短缺如何影响机器学习博士培养

作者头像
分析师熊大 本文作者

2025-2-13 阅读 164 约 21分钟读完

评论0

来自美国前五名大学的机器学习医生甚至没有可以提供大量计算能力的GPU?

在2024年中,网民在Reddit上发布了一篇文章,立即引发了大规模的社区讨论 -

在今年年底,《大自然》的一份报告揭示了GPU收购中学者面临的艰巨挑战 - 研究人员实际上不得不排队以申请使用学校GPU群集。

同样,在我国大学实验室中,严重缺乏GPU的问题也很普遍。它甚至揭示了大学要求学生为课堂提供自己的计算能力。

可以看出,瓶颈“计算能力”甚至将AI本身变成了一个极高阈值的课程。

人工智能才华很少,计算能力不足

同时,诸如大型模型和具体智能等尖端技术的快速发展正在导致全球人才短缺。

根据牛津教授的计算,在美国,需要AI技能的工作比例增加了五倍。

环顾四周,科技-AI的工作量增加了9倍,而在Broad-ai的工作增加了11.3倍。

在此期间,亚洲的增长尤为重要。

尽管世界各地的大学试图帮助学生掌握密钥AI的表现,但计算能力已成为现在的“奢侈品”。

为了弥合这一差距,企业与大学之间的合作已成为重要的手段。

Kunpeng Asenten科学与教育创新孵化中心开设了大学和大学的科学研究布局

幸运的是,为了在我们的大学培养相同的创新系统,华为已经开始安排!

现在,华为已与五所顶级大学,北京大学,上海北北大学,郑安格大学和中国科学技术大学签署了合作。

此外,华为还同时促进并开展了10所大学,包括福丹大学,哈尔滨技术学院,华盛顿科学技术大学,北京大学,北京大学,北京大学,航空航空大学和星际学院,北京大学,北京大学,北京大学,北京大学,北京大学东南大学电子科学技术大学和北京邮政与电信大学。举行了“ Kunpeng Asenten科学与教育创新孵化中心”的合作。

建立卓越和孵化中心的中心是行业和教育融合的模型:

为人工智能研究建立完全独立的国内计算能力

如今,AI对科学的重要性是不言而喻的。

根据Google DeepMind的最新调查,每三个博士后研究人员中每三分之一使用大型语言模型来协助文学审查,编程和文章写作。

今年的诺贝尔物理和化学奖获得了AI领域的研究人员。

可以看出,在AI增强科学研究的过程中,GPU已成为一种宝贵的“黄金”,其在这些领域的出色表现需要高性能计算以及其强大的LLM培训和理由的能力。 ,它被Microsoft,XAI和Openai等主要公司抢劫。

但是,美国对GPU的封锁使我国在AI和科学研究中的进步变得困难。

为了跨越这一差距,我们必须建立一个独立而完整的生态系统并发展它。

在计算能力水平上,华为Ascend Series AI处理器履行了重塑我国家竞争力的重要任务。

在计算能力方面,我们还需要拥有一个自发开发的计算框架来适应它,以便全面发挥NPU/AI处理器的优势。

众所周知,专为NVIDIA GPU设计的CUDA体系结构在AI和数据科学领域更为常见。

在该国,只有Cann是唯一真正与之竞争的人。

作为华为为AI方案推出的异质计算体系结构,Cann支持顶部的主流AI框架,例如Pytorch,Tensorflow和Shengsi Mindspore。在底部启用ASEN AI处理器是提高ASEN AI处理器计算效率的关键。平台。 。

因此,Cann天生具有许多技术优势。最关键的是AI计算和更开放的软件堆栈的更深层软件和硬件优化:

目前,Cann最初建立了自己的生态系统。在技​​术层面上,Cann包括大量的应用程序,工具和库,并具有完整的技术生态系统,为用户提供一站式开发体验。同时,基于上升技术基础的开发人员团队逐渐发展,为未来的技术应用和创新奠定了基础。

除了异质的计算体系结构CANN之外,我们还需要一个由AI模型构建的深度学习框架。

几乎所有AI开发人员都需要使用深度学习框架,几乎所有DL算法和应用都必须通过深度学习框架来实现。

如今,有众所周知的主流框架,例如Google Tensorflow和Meta的Pytorch,并形成了一个巨大的生态系统。

进入大型模型培训的时代,在面对数千台计算机的规模时,需要有效地培训深度学习框架。

华为Shengsi Mindspore是一个全景深度学习框架,于2020年3月正式开放,弥补了该领域中国的差距,并实现了真正的独立性和可控性。

Mindspore具有关键特征,例如云边缘部署,对大型模型培训的本机支持以及对AI+科学计算的支持。它通过全赛季的合作和简约的流程建立了本地发展环境,加速了国内科学研究创新和工业应用。

特殊的是,作为Ascend AI处理器的“最佳合作伙伴”,Mindspore支持“ End,Edge和Cloud”的完整场景,并且可以实现统一的体系结构,一次性培训和多个部署。

从大到地球系统模拟和自动驾驶到小到蛋白质结构的预测,一切都可以通过Shengsi Mindspore实现。

只有广泛的开发人员生态系统才能在深度学习开源框架中促进其改进并释放更大的价值。

研究机构OMDIA在2023年发布的“中国人工智能框架市场研究报告”表明,Mindspore进入了AI框架使用的第一个梯队,仅次于TensorFlow。

此外,在数千个行业中推理的应用是释放AI价值的关键。在加速的加速发展过程中,大学和企业都需要解决对加速推理的高需求。

例如,高性能优化的编译器Tensorrt是提高大规模模型推断性能的强大工具。通过量化和稀疏性,它可以降低模型的复杂性,从而有效地优化深度学习模型的推理速度。但是问题在于它只支持NVIDIA的GPU。

如上所述,我们既有计算体系结构又有深度学习框架,并且还将拥有相应的推理引擎-Huawei Ascend Mindie。

Mindie是一款全景AI推理加速引擎,它集成了行业最先进的推理加速技术并继承开源Pytorch的功能。

它的设计考虑了灵活性和实用性,可以与各种主流AI框架无缝连接,并支持不同类型的Ascend AI处理器,从而为用户提供多级编程接口。

通过全堆栈联合优化和分层开放AI功能,Mindie可以释放Ascend硬件的最终计算能力,从而为用户提供高效,快速的深度学习推理解决方案,并解决模型推理和开发模型推理的技术困难和发展。多个步骤的问题可改善模型吞吐量性能,缩短应用程序的启动时间,使所有模型和各种AI业务需求。

可以看出,诸如Cann,Mindspore和Mindie之类的独立创新技术不仅填补了国内计算能力的缺点,而且还实现了模型培训,框架易用性,推理性能等的跨越突破,甚至直接基准为反对先进的外国技术。堆。

建立世界一流的孵化中心

除了具有技术优势外,还可以说,在接下来的几十年中,使用上升计算能力将更符合国家条件的需求。

只有国内自发展的计算能力才能摆脱不断变化的外部环境的影响,并确保科学研究基金会的稳定性。

现在设置了平台,学院和大学中的教师和学生如何学习使用它?

自去年9月6日以来,华为连续举办了四所主要大学的第一个登顶AI特殊训练营:北海大学北海大学,智格大学和中国科学技术大学。在签约参加的数百名学生中,有90%的硕士和博士生来占主导地位,这些课程涵盖了Ascend Field的许多课程,包括Cann,Mindspore,Mindspore,Mindie,Mindspeed,Mindspeed,HPC,Kunpeng Development工具和其他方面。

在特殊的训练营中,学生不仅对核心技术有详细的了解,而且有机会实践动手。这种安排与学生的吸收特征是从浅到深到深的,并逐步逐步的新知识的吸收特征。

例如,在交换过程中,课程的第一天将基于迁移,使学生能够理解ASCEND AI基本软件和硬件解决方案,Pytorch模型Ascend Ascend Aspend Native案例实践,Mindie推论解决方案特征和迁移案例等。

第二天的课程将重点放在优化上,包括上升的异质计算体系结构CANN,ASCEND C运营商开发,大规模的长期推论优化实践等。

课程设置的迁移和优化是深远的。

您应该知道,许多大学的实际课程基本上是基于CUDA/X86建立的,但是在制裁的影响下,计算能力不足的问题变得越来越重要。目前,如果您掌握了迁移方法,则可以将项目放在Ascend的平台上,以保持学者运行。

掌握了基本知识后,学生可以在实际案例部分中自己接受。华为的专家将逐步指导学生,使他们能够学习上升的技术堆栈,并在大型模型量化,推理和CodElabs代码实现和扩展过程中体验大型模型推断的整个过程。

经过实践经验,学生将通过个人经验更好地了解上升生态学,为在技术领域的未来工作奠定了坚实的基础。

第一个特殊的训练营移交了,学生正在进行动手练习

除了课程外,华为还将举办运营商挑战赛,以供大学开发人员探索运营商开发人员。

竞争鼓励开发人员根据上升计算资源和Cann的基本功能进行深入的创新和实践,加速AI和行业的整合,并促进开发人员能力的提高。

此外,孵化中心还非常重视学术成就。

基于Kunpeng或Ascend Computing关键技术和工具进行学术研究的学生也可以申请研究生奖学金。在此期间,如果本文发表在国际顶级会议和国内顶级期刊上,将会有相应的奖励。

同时,华为还与Kunpeng&Ascend生态系统合作伙伴联手制定了人才计划。

该计划使学生可以从理论练习,进入公司的真实工作场景,并帮助杰出学生提前与公司联系。

现在,人才计划已与15个城市的200多家公司联手,提供了2,000多个技术职位,并允许10,000多名大学生申请职位。

总的来说,通过这些教学实践和励志计划,学生对参与的热情可以大大提高。他们不仅可以提高学术经验并产生科学研究成果,而且还将使他们的经验和背景更加引人注目,从而在就业市场上获得奖励积分,并受到顶级家庭和外国公司的青睐。

因此,在掌握了最新技术及其应用之后,我们如何培养真正的突破性科学研究导致当今不断变化的AI?

自从Sora在2024年推出了Wensheng视频的AI浪潮以来,Wensheng视频电影一直在出现。北京大学和图寿大学的开源Wensheng视频项目Open-Sora Plan曾经在该行业引起震惊。

实际上,该团队早在Sora发布时就已经为Sora的开源版本做准备,但是没有满足计算能力和数据的要求,并且该项目曾经被搁置。幸运的是,北京大学和华为共同建立了Kunpeng Asenten科学和教育创新中心,使团队能够快速获得计算能力支持。

最初,该团队使用了NVIDIA A100。迁移了上升生态系统后,他们做出了各种惊喜的发现 -

CANN的支持可以实现高性能并行计算,从而大大加快了大规模数据集的处理速度; Ascend C接口库简化了AI应用程序的开发过程;操作员加速库进一步优化了算法的运行性能。

更重要的是,开放的上升生态系统可以快速适应大型模型和应用。

因此,尽管团队成员从0开始与Ascend生态系统联系,但他们能够在很短的时间内迅速开始。

在下一次培训中,团队一直在发现惊喜:例如,在使用Torch_npu进行开发时,可以在Asteng NPU上对整个代码进行无缝培训并进行推理。

当需要模型分割时,上升的思维速度分布式加速套件提供丰富的大规模分布式算法和并行策略。

此外,在大规模培训中,使用Mindspeed和Ascend硬件的稳定性比其他计算平台的稳定性高得多,并且可以在一周内不间断。

因此,仅仅一个月后,开放式计划正式启动,在该行业获得了极大的认可。

开放式计划产生的“黑色神话:wukong”的场景与一部令人惊讶的无数网民相媲美

此外,对于上升计算能力,东南大学还开发了多模式的大型Model MT-GPT。

过去,交通大型模型的实施非常困难,原因包括由不同政府部门收集数据,数据格式和标准不一致的数据孤岛,异质的多源流量数据等。

为了解决这些问题,团队专门构思了一个称为MT-GPT(多模式运输生成培训训练的变压器)的多模式交通模型的概念框架,以在多模式交通系统任务中提供多维和多元数据的决策问题。数据驱动。

但是,在大型模型的开发和培训中,无疑是计算功率基础的高要求。

为此,团队选择使用Ascend AI的功能来加快交通大型模型的开发,培训,调整和部署。

在开发阶段,变压器大规模模型开发套件通过多源异质知识语料库和多模式特征编码共同提高了多模式生成问题的理解准确性。

在训练阶段,Ascend Mindspeed分布式培训套件提供了用于交通大型模型的多维,多模式和多模式加速算法。

在调整阶段,MindStudio的完整工具链将精细调整的交通专有知识结合在一起,以进行培训和微调。

在部署阶段,上升的Mindie推理引擎可以帮助进行交通模型的一站式推断,还可以支持跨城市迁移分析,开发,调试和调整。

总而言之,可以发现北京大学开放式索拉是一个重现Sora的迁移项目。作为一个开源项目,它还可以更好地授权全球开发人员在方案中执行更多应用程序。

东南大学的多模式运输大型型号MT-GPT反映了Ascend在结果转变中的实际能力,直接增强了城市的运输行业的能力。

结果,已经完全形成了生产,教育和研究之间的封闭循环。

这些富有成就的成就也进一步证明了这一点:卓越/孵化中心的中心不仅可以为大学提供学术研究和科学创新的沃土,而且还培养了大量的AI顶级人力资源,并孵化了领导世界的科学研究结果。

例如,在北京大学团队制定开放式计划计划的过程中,老师Yuan Li将组织学生和华为Ascend团队每天集思广益,以集思广益。

在感觉到河对岸的石头时,北京大学团队的许多学生亲自参加了一项高质量的科学研究实践,这表明了非常高的科学研究创造力。

这支平均年龄23岁的团队也已成为促进国内AI视频应用的骨干。

在此过程中,掌握Kunpeng Ascend生态系统的青年学习团队也在增长。

因此,大学进行基于国内计算能力和平台的研究,不仅获得了顶级情报的支持,而且还扩大了华为的技术生态系统和在此过程中的应用。

我们的国家应该建立什么样的创新系统?

可以看出,华为已正式启航,以进行新的企业合作的新范式。

自2019年建立计算产品线以来,华为很快就与教育部于2020年签署了一项关于智能码头的合作项目,并在该国前72家大学之间进行了教学合作。

当时,一些昆彭/阿斯登已纳入了一些强制性的本科课程。

但是,对高​​校的投资是中期和长期的培养过程。只有优先考虑学生和老师了解相关技术,才能在未来几年内实现更大的价值。

因此,华为计划每年投资10亿元人民币,以发展昆彭和阿斯滕的本地生态和才华。该战略的实施将为大学才能和开发人员提供更丰富的资源和更广泛的发展空间。它还启动了100,000个Kunpeng开发委员会,并升级推理开发委员会的礼物计划,以鼓励他们进行教学实验。 ,在竞争实践以及科学和技术创新中积极探索和应用Kunpeng和Ascend Technologies。

根据该计划,教师和学生可以接触和试用开发委员会。无论是教师的教学还是科学研究实验,大学教师和学生都可以通过了解他们想要做出的常识来激发新的灵感。

由Orangepi和华为Ascend共同启动的Orangepi AIPRO开发委员会满足了大多数AI算法原型验证和推理应用程序开发的需求,并且可以广泛用于AI边缘计算,深视觉学习,无人机,云计算和其他领域。表现出强大的强度和广泛的适用性

另一方面,我国当前的特殊情况 - 外界的技术封锁也意味着我们没有太多时间。我们必须有一个独立且可控的技术堆栈。

将来,本地发展已经是必须的。仅在中国制造的最符合中国未来的主要国家状况。

随着国内生产成为一般趋势,国内技术堆栈(例如Kunpeng/Second)也将扩散到各种IT基础设施。

卓越和孵化中心的启动也使该行业越来越自信。

可以预见的是,经过数年的孵化,掌握国内技术基础的科学研究才能将继续推进Kunpeng/第二技术途径,并孵化科学研究成果,足以领导世界。

上一篇 最高检加大对食药安全犯罪督办力度,天津河北油罐车运输食用油案件已公诉 下一篇 最高检揭示:证券期货违法犯罪新趋势,欺诈发行与违规披露案件激增
评论
更换验证码