最新最快汽车新闻
太阳能光伏网

美国大学让AI设想"看不到的东西" 可提高自动驾驶汽车的安全性

想象一下有一只橘猫,然后再想象一下这只猫是煤灰色的,现在,再想象一下,这只猫正在长城上昂首阔步。做出上述想象时,人们大脑中的一系列神经元会快速激活,并根据之前对世界的认知,想出各种各样的图片。换句话说,人类很容易想象一个具有不同属性的物体。但是,尽管深度神经网络上在执行某些任务是能够取得与人类一样或超越人类的表现,但是,计算机在“想象”技能方面仍在与人类处于较量中。

据外媒报道,美国南加州大学的一支研究团队研发了一种人工智能(AI)技术,能够利用与人类类似的能力想象拥有不同属性、之前从未见过的物体。该支团队由Laurent Itti教授、博士生Yunhao Ge、Sami Abu-El-Haija和Gan Xin组成。研究人员表示:“我们受人类视觉泛化能力的启发,尝试在机器中模拟人类的想象力。人类能够根据形状、姿势、位置、颜色等属性将所学的知识分开,然后再把此类知识结合起来想象一个新的物体。

AI的泛化问题

例如,假设你想创建一个能够生成车辆图片的AI系统。在理想情况下,你能够为该算法提供一些车辆的图片,然后其能够生成各种颜色、不同角度的各种汽车,如保时捷、庞蒂亚克、皮卡等。

这也是AI长期追求的目标之一,即创建能够外推的模型,这也意味着,只要给出一些例子,该模型能够提取出基本的规则,并将此类规则应用到各种新颖、之前从未见过的例子中。但是,机器通常只训练像素等样本特征,而不会考虑到物体的属性。

想象力的科学

在此次新研究中,研究人员利用一种称为分离(Disentanglement)的概念试图克服此种限制。例如,分离能够用于生成深度伪装(deepfakes),将人类的面部运动和身份分离,然后合成新的图片和视频,用另一个人替代原来的人,但是还是原来的面部运动,类似于换脸技术。

类似上述方法,不像传统的算法一样只采用一个样本,新方法采用了一堆样本照片并挖掘两者之间的相似性,以实现“可控分离表征学习”(controllable disentangled representation learning)。

然后,该方法会重新组合知识,以实现“可控新图像合成”,或者人们所说的想象。例如,以变形金刚为例,它能够采用威震天汽车的外形,但是采用黄色大黄蜂的颜色和姿势以及纽约时代广场的背景。最后是一辆黄色大黄蜂颜色的威震天汽车在时代广场行驶,即使在训练过程中并没有人看到此种样本。

然后,该方法会重新组合知识,以实现“可控新图像合成”,或者人们所说的想象。例如,以变形金刚为例,它能够采用威震天汽车的外形,但是采用黄色大黄蜂的颜色和姿势以及纽约时代广场的背景。最后是一辆黄色大黄蜂颜色的威震天汽车在时代广场行驶,即使在训练过程中并没有人看到此种样本。

理解这个世界

虽然分离不是一个新概念,研究人员表示,该框架能够与几乎任何类型的数据或知识兼容,扩大其应用范围。例如,通过将敏感属性从等式中移动,分离种族和性别相关知识,以实现更公平的AI。

在医学领域,该技术能够通过将药物的功能从其他属性中分离,然后在重新组合以合成新的医药,从而帮助医生和生物学家发现更有用的药物。赋予机器想象力还能够帮助创造更安全的AI,例如,让自动驾驶汽车在训练中想象并避开之前未看到的危险场景。

最新相关

Seeds | 灵猴完成数千万元A+轮融资

据盖世汽车Seeds报道,11月29日,苏州灵猴机器人有限公司宣布已于近日完成数千万元A+轮融资。据悉,灵猴机器人本次融资不仅引入了在具身智能领域极具影响力的产业投资者成为新股东,还获得了老股...

特斯拉将推出车内雷达新警报功能

据外媒报道,特斯拉(Tesla)在其最新的重大软件更新2025.32中引入了一项功能: 如果车内雷达被遮挡,系统会发出警报。新型车辆中的车内雷达正被用于执行越来越重要的任务,例如检测座椅占用情况、...

优必选再中标亿元人形机器人项目

11月28日,优必选宣布成功中标江西省九江市人形机器人数据采集与训练中心项目,中标金额为1.43亿元。该项目将采用优必选最新款工业人形机器人Walker S2,该型号具备自主换电功能,旨在推动人形机...

Robotaxi暴涨761.0%,文远知行即将"跑赢"?

Robotaxi暴涨761.0%,文远知行即将"跑赢"?

在全球自动驾驶行业历经资本狂热与技术憧憬,转而进入漫长商业化验证周期的当下,任何一家头部企业的财务数据都如同一个重要的风向标。近期,文远知行发布的第三季度财务报告,无疑为略显沉闷的市...