帮助机器人独立练习技能以适应不熟悉的环境

作者:Alex Shipps | MIT CSAIL     时间:2024-09-09 08:22:59

“熟能生巧”这句话通常是为人类保留的,但对于新部署到陌生环境中的机器人来说,这也是一句至理名言。

想象一个机器人到达仓库。它具备了训练过的技能,比如放置物品,现在它需要从不熟悉的架子上挑选物品。起初,机器与此斗争,因为它需要熟悉它的新环境。为了改进,机器人将需要了解在整个任务中需要改进的技能,然后专门(或参数化)该动作。

现场的人可以对机器人进行编程,以优化其性能,但麻省理工学院计算机科学与人工智能实验室(CSAIL)和人工智能研究所的研究人员已经开发出一种更有效的替代方案。在上个月的机器人:科学与系统会议上,他们的“估计、外推和定位”(EES)算法使这些机器能够自己练习,有可能帮助它们在工厂、家庭和医院中改进有用的任务。

为了帮助机器人更好地完成扫地等活动,EES与一个视觉系统合作,该系统可以定位和跟踪机器周围的环境。然后,算法估计机器人执行动作(如清扫)的可靠性,以及是否值得进行更多的练习。EES预测,如果机器人改进了特定的技能,并最终进行练习,它将如何出色地完成整个任务。视觉系统随后会在每次尝试后检查该技能是否正确完成。

在人工智能研究所的研究试验期间,在波士顿动力公司的Spot四足动物上实施EES的高效学习技巧是显而易见的。这个背部有一只手臂的机器人在练习几个小时后完成了操作任务。在一次演示中,机器人在大约三个小时内学会了如何安全地将球和戒指放在倾斜的桌子上。在另一个实验中,该算法引导机器在大约两小时内提高了将玩具扫进垃圾箱的能力。这两个结果似乎都是对以前框架的升级,以前的框架可能每个任务需要花费10多个小时。

“我们的目标是让机器人收集自己的经验,这样它就能更好地选择在部署中有效的策略,”共同主要作者汤姆·西尔弗(Tom Silver)说,他是电气工程和计算机科学(EECS)校友和CSAIL的成员,现在是普林斯顿大学的助理教授。“通过关注机器人所知道的,我们试图回答一个关键问题:在机器人拥有的技能库中,哪一项对现在的练习最有用?”

EES最终可以帮助简化机器人在新部署环境中的自主实践,但目前,它有一些限制。首先,他们使用了离地面较低的桌子,这样机器人更容易看到它的物体。Kumar和Silver还3D打印了一个可连接的手柄,使刷子更容易被Spot抓住。机器人没有检测到一些物品,并且在错误的地方识别了物体,因此研究人员将这些错误视为失败。

研究人员指出,在模拟器的帮助下,物理实验的练习速度可以进一步加快。机器人最终可以将真实和虚拟的练习结合起来,而不是自主地学习每一项技能。他们希望让他们的系统更快,延迟更短,通过工程EES来克服研究人员经历的成像延迟。在未来,他们可能会研究一种算法,这种算法可以对一系列的练习尝试进行推理,而不是计划哪些技能需要改进。

佐治亚理工学院交互计算学院助理教授、英伟达人工智能研究科学家徐丹飞表示:“让机器人自主学习既非常有用,又极具挑战性。”他没有参与这项工作。“未来,家用机器人将被销售到各种家庭,并有望执行广泛的任务。我们不可能事先把他们需要知道的一切都安排好,所以他们在工作中学习是很重要的。然而,让机器人在没有指导的情况下自由探索和学习可能会非常缓慢,并可能导致意想不到的后果。西尔弗和他的同事们的研究引入了一种算法,允许机器人以一种结构化的方式自主练习技能。这是朝着创造能够不断自我进化和改进的家用机器人迈出的一大步。”

作者:Alex Shipps | MIT CSAIL

链接:https://news.mit.edu/2024/helping-robots-practice-skills-independently-adapt-unfamiliar-environments-0808

著作权归作者所有。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:152 6451 3609,邮箱:1027830374@qq.com

联系我们
咨询反馈