具身人工智能(AI)系统是一种机器人代理,它依靠机器学习算法来感知周围环境、规划并执行动作。这些系统的关键组成部分是视觉感知模块,该模块使系统能够分析摄像头捕捉的图像并进行解读。
目前大多数用于具身AI代理的视觉感知模块都依赖于RGB-D摄像头,这种设备可以同时捕捉彩色(RGB)图像和深度(D)信息。然而,在大多数情况下,这些摄像头固定在机器人上,位置固定,这限制了它们在动态复杂环境中检测变化的能力。

据外媒报道,上海交通大学、中国科学院和大连理工大学的研究人员近期开发了一种受人眼启发的新型机器人系统,该系统能够旋转和放大,无需额外的传感器或更昂贵的摄像头即可获取物体的清晰图像。这款名为EyeVLA的机器人眼球已发表在arXiv预印本服务器上。

扫一扫关注微信