最新最快汽车新闻
太阳能光伏网

KAUST将机器学习训练速度提高7倍 有助于改进自动驾驶汽车等应用

据外媒报道,沙特阿拉伯阿卜杜拉国王科技大学(KAUST)的研究人员发现了一种能够显著提升训练速度的方法。通过观察采用大型训练数据库的分布式机器学习中产生结果零的频率,可以显著加快大型机器学习模型的训练速度。

AI模型通过在数据库上进行训练来开发“智能”,而此类数据库都被事先标记好,以告知模型如何区分不同输入信息,然后再做出相应的反应。输入的已标记数据越多,该模型就越擅长完成分配给它的任务。对于自动驾驶汽车等复杂深度学习应用而言,它们需要大量输入的数据库以及很长的训练时间,即使采用了强大且昂贵的高度并行超级计算平台也是如此。

在训练期间,小型的学习任务被分配给数十或数百个计算节点,然后在运行下一个任务之前,这些计算节点会通过通信网络分享结果。在此种并行计算任务中,计算量消耗最大的来源之一是每个模型步骤中计算节点之间的通信。

KAUST的研究人员表示:“在分布式深度学习中,通信是主要的性能瓶颈。随着模型规模的迅速增长,我们还看到在学习过程中产生零值的比例在增加,称为稀疏性。我们的想法是利用此种稀疏性,通过只发送非零数据块来尽可能提高有效带宽的使用效率。”

基于KAUST早期研发的SwitchML方法,即通过在处理数据传输的网络交换机上运行高效的聚合代码来优化节点间的通信,研究人员希望能够通过识别结果零,并研发一种方法,以在不中断并行计算过程中,同步减少传输,而进一步优化该方法。

研究人员表示:“确切地说,如何利用稀疏性来加速分布式训练是一个具有挑战性的问题。所有的节点需要在同一时间内处理同一个位置的数据块,因此我们必须协调节点,以确保只聚合同一个位置的数据块。为了克服这个问题,我们打造了一个聚合程序以协调此类工作者,指导它们接下来发送哪个数据块。”

该团队在一个由一组图形处理单元(GPU)构成的测试台上展示了其OmniReduce方法,并且在典型深度学习任务中速度加快了7倍。

最新相关

特斯拉将推出车内雷达新警报功能

据外媒报道,特斯拉(Tesla)在其最新的重大软件更新2025.32中引入了一项功能: 如果车内雷达被遮挡,系统会发出警报。新型车辆中的车内雷达正被用于执行越来越重要的任务,例如检测座椅占用情况、...

优必选再中标亿元人形机器人项目

11月28日,优必选宣布成功中标江西省九江市人形机器人数据采集与训练中心项目,中标金额为1.43亿元。该项目将采用优必选最新款工业人形机器人Walker S2,该型号具备自主换电功能,旨在推动人形机...

Robotaxi暴涨761.0%,文远知行即将"跑赢"?

Robotaxi暴涨761.0%,文远知行即将"跑赢"?

在全球自动驾驶行业历经资本狂热与技术憧憬,转而进入漫长商业化验证周期的当下,任何一家头部企业的财务数据都如同一个重要的风向标。近期,文远知行发布的第三季度财务报告,无疑为略显沉闷的市...