最新最快汽车新闻
太阳能光伏网

MIT重新构想图像生成 标记器和解码器无需生成器即可进行编辑和修复

人工智能图像生成——依靠神经网络根据各种输入(包括文本提示)创建新图像——预计到本世纪末将成为一个价值数十亿美元的产业。即使以今天的技术,如果想要创作一幅奇特的画面,比如一位朋友在火星上插上国旗,或者漫不经心地飞进黑洞,也只需不到一秒钟。

然而,在图像生成器能够执行此类任务之前,它们通常需要接受海量数据集的训练,这些数据集包含数百万张图像,通常还配有相关文本。训练这些生成模型可能是一项艰巨的任务,需要数周甚至数月的时间,并且会消耗大量的计算资源。

但是,如果真的可以通过人工智能方法生成图像,而无需使用生成器,那会怎样呢?

据外媒报道,2025年夏初,在加拿大不列颠哥伦比亚省温哥华举行的国际机器学习大会(International Conference on Machine Learning,ICML 2025)上,一篇研究论文阐述了这种现实可能性以及其他一些引人入胜的想法。研究人员重新构想图像生成,使标记器和解码器无需生成器即可进行编辑和修复图像。相关论文已发表在arXiv预印本服务器上。

论文由麻省理工学院(MIT)信息与决策系统实验室(LIDS)研究生研究员Lukas Lao Beyer、麻省理工学院计算机科学与人工智能实验室(CSAIL)博士后研究员Tianhong Li、Facebook人工智能研究中心的Xinlei Chen、麻省理工学院航空航天学教授兼LIDS主任Sertac Karaman以及麻省理工学院电气工程与计算机科学副教授Kaiming He共同撰写。

这项团队研究的起源是Lao Beyer去年秋季参加的深度生成模型研究生研讨课的课堂项目。在学期中的交流中,Lao Beyer和研讨课的授课老师He都意识到这项研究具有真正的潜力,远远超出了普通家庭作业的范畴。很快,其他合作者也加入了进来。

Lao Beyer的研究起点是一篇发表于2024年6月的论文,该论文由慕尼黑工业大学(Technical University of Munich)和中国公司字节跳动的研究人员共同撰写,该论文介绍了一种新的视觉信息表示方法,称为一维标记器。利用这种设备(它也是一种神经网络),可以将256x256像素的图像转换为仅由32个数字组成的序列,这些数字被称为标记。

最新相关
[全球汽车新技术观察] 5月上期〡安道拓推出ProForce Massage Flow座椅按摩方案;韩国研究人员开发出光可调谐偏振传感器,有望提升自动驾驶汽车精准度;南洋理工大学研制出的新太阳能电池有望将车窗变成发电机

[全球汽车新技术观察] 5月上期〡安道拓推出ProForce Massage Flow座椅按摩方案;韩国研究人员开发出光可调谐偏振传感器,有望提升自动驾驶汽车精准度;南洋理工大学研制出的新太阳能电池有望将车窗变成发电机

本期全球前沿汽车技术动向如下,如需更具体的内容与分析解读,欢迎订购盖世汽车研究院《全球前瞻技术情报》。智能网联安道拓推出ProForce Massage Flow座椅按摩方案汽车座椅供应商安道拓宣布推...

村田推出汽车用树脂外部电极片状MLCC

村田推出汽车用树脂外部电极片状MLCC

6月4日,株式会社村田制作所(Murata Manufacturing Co., Ltd.)推出适用于汽车动力总成及安全设备的软端子型片状多层陶瓷电容器(MLCC)--GCJ21BD72A225KE02。作为全球首款软端子型片状MLCC,该产...

福特汽车申请方向盘托盘专利

据外媒报道,福特汽车公司(Ford Motor Company)已申请了一项关于方向盘托盘的专利,该装置有望应用于未来的福特车型中。该专利于2024年7月29日提交申请,于2026年6月2日正式公布,并获分配序列号1...

小米机器人团队拿下双料冠军

小米机器人团队拿下双料冠军

6月5日,盖世汽车获悉,雷军官宣小米机器人努力方向雷军微博称: 小米机器人团队,在最近两大国际赛事中拿下双料冠军,而且,大幅领先第二名。图片来源: 小米技术雷军发文列举: 1、CVPR 2026 Worksh...

FF已完成Master人形机器人交付

6月5日,盖世汽车获悉,法拉第未来表示,FF已向洛杉矶一家知名医疗机构完成Master人形机器人交付,标志着FF EAI机器人首次落地医疗健康应用场景。据悉,此次交付对象为Wonderful Life Dental Group...

5月具身智能融资: 喧嚣回落,量产提速

5月具身智能融资: 喧嚣回落,量产提速

在刚刚过去的5月,具身智能赛道交出了一份略显矛盾的成绩单。一边是RoboScience在A轮就拿下10亿元,鹿明机器人、维他动力、中科第五纪等早期项目也接连斩获数亿级融资,大钱仍在持续向头部集中。...