环球门户网

可以自主探索现实世界环境的机器人

更新时间:2024-11-05 09:02:56

导读 机器人专家在过去十年左右的时间里开发了许多先进的系统,但这些系统中的大多数仍然需要一定程度的人类监督。理想情况下,未来的机器人应该...

机器人专家在过去十年左右的时间里开发了许多先进的系统,但这些系统中的大多数仍然需要一定程度的人类监督。理想情况下,未来的机器人应该自主和独立地探索未知环境,不断收集数据并从这些数据中学习。

卡内基梅隆大学的研究人员最近创建了ALAN,这是一种可以自主探索陌生环境的机器人代理。该机器人在arXiv上预先发表的一篇论文中介绍,并将在国际机器人与自动化会议(ICRA 2023)上发表,经过短暂的探索试验后,发现该机器人在现实世界中成功完成了任务。

“我们一直对建立一个通过设定自己的目标来学习的人工智能感兴趣,”进行这项研究的研究人员之一Russell Mendonca告诉Tech Xplore。“通过不依赖人类的监督或指导,这些智能体可以在自己的好奇心的驱使下,在新场景中继续学习。这将能够不断推广到不同的领域,并发现越来越复杂的行为。

卡内基梅隆大学的机器人小组已经引入了一些自主代理,这些代理可以在很少或没有额外训练的情况下在新任务上表现良好,包括一个训练可以玩马里奥视频游戏的模型和一个可以完成多阶段对象操作任务的系统。但是,这些系统仅在模拟环境中进行训练和测试。

该团队最近研究的主要目标是创建一个可以应用于世界上物理机器人的框架,提高它们探索周围环境和完成新任务的能力。他们创建的系统ALAN学会自主探索其环境,而无需从人类代理那里获得奖励或指导。随后,它可以重新利用过去学到的知识来解决新的任务或问题。

“ALAN 学习了一个世界模型来计划其行动,并使用以环境和代理为中心的目标来指导自己,”门东卡解释说。“它还使用现成的预训练探测器将工作空间减少到感兴趣的区域。探索后,机器人可以拼接发现的技能,以执行通过目标图像指定的单阶段和多阶段任务。

研究人员的机器人具有一个视觉模块,可以估计周围物体的运动。然后,该模块使用这些物体如何移动的估计来最大化物体的变化,并鼓励机器人与这些物体进行交互。

“这是一个以环境为中心的信号,因为它不依赖于代理人的信念,”门东卡说。“为了提高对物体变化的估计,ALAN需要对此感到好奇。为此,ALAN 使用其学习到的世界模型来识别不确定预测对象变化的动作,然后在现实世界中执行它们。这种以代理为中心的信号随着机器人看到更多数据而发展。

以前提出的自主机器人探索方法需要大量的训练数据。这阻止或显着限制了它们在真实机器人上的部署。相比之下,Mendonca和他的同事提出的学习方法允许ALAN机器人在探索周围环境时持续自主地学习完成任务。

“我们表明,ALAN 可以在两个不同的游戏厨房中学习如何在 100-1 小时内操纵只有大约 2 条轨迹的物体,没有任何奖励,”门东卡说。“因此,使用视觉先验可以大大提高机器人学习的效率。该系统以24/7全天候运行的扩展版本将能够不断获得新的有用技能,同时最大限度地减少跨领域的人为干预,使我们更接近通用智能机器人。

在最初的评估中,该团队的机器人表现非常好,因为它能够在没有任何培训或人类代理帮助的情况下快速学习完成新的操作任务。未来,ALAN 及其基础框架可以为创建性能更好的环境探索自主机器人系统铺平道路。

“接下来,我们想研究如何利用其他先验来帮助构建机器人的行为,例如人类执行任务的视频和语言描述,”Mendonca补充道。“能够有效地建立在这些数据上的系统将能够通过在结构化空间中运行来更好地自主探索。此外,我们对多机器人系统感兴趣,这些系统可以汇集他们的经验来不断学习。

版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。