人类帮助机器人学习任务

在斯坦福大学盖茨计算机科学大楼的地下室,一个红色机器人手臂的屏幕亮起。一双卡通眼睛闪烁。“与Bender见面,”电气工程博士生Ajay Mandlekar说。

Bender是斯坦福大学研究人员用来测试两个框架的机器人手臂之一,这两个框架一起可以更快,更容易地教授机器人的基本技能。RoboTurk框架允许人们通过智能手机和浏览器实时引导机器人手臂,向机器人展示如何执行拾取物体等任务。SURREAL通过一次运行多种体验来加速学习过程,从根本上允许机器人同时学习许多经验。

“通过RoboTurk和SURREAL,我们可以通过结合人类收集的大量数据并将其与大规模强化学习结合起来,突破机器人可以做的界限,”开发框架的团队成员Mandlekar说。

该小组将于10月29日在瑞士苏黎世的机器人学习会议上展示RoboTurk和SURREAL。

人类教学机器人

Yuke Zhu是计算机科学博士生,也是团队成员,他通过在iPhone上打开应用程序并在空中挥动来展示系统的工作原理。他引导机器人手臂 - 就像街机游戏中的机械起重机一样 - 将鼠标悬停在他的奖品上:一块木板画成看起来像牛排。这是一个简单的取放任务,包括识别对象,拾取它们并将它们放入具有正确标签的bin中。

对人类而言,这项任务似乎非常容易。但对于今天的机器人来说,这是相当困难的。机器人通常通过与环境进行交互和探索来学习 - 这通常导致大量随机挥动手臂 - 或者来自大型数据集。这些都不如得到一些人的帮助那么有效。就像父母教他们的孩子通过引导他们的手刷牙一样,人们可以向机器人展示如何做特定的任务。

然而,这些课程并不总是完美的。当朱在手机屏幕上用力按压并且机器人松开手柄时,木制牛排撞到了垃圾箱的边缘,然后咔哒咔哒地撞到了桌子上。“人类在这方面绝不是最佳选择,”Mandlekar说,“但这种经验对于机器人来说仍然是不可或缺的。”

更快地学习并行

这些试验 - 甚至是失败 - 提供了宝贵的信息。通过RoboTurk收集的演示将为机器人提供背景知识,以启动他们的学习。SURREAL可以同时在全球范围内运行数以千计的模拟体验,以加快学习过程。

“通过SURREAL,我们希望加快这种与环境互动的过程,”计算机科学博士生兼团队成员林曦曦说。这些框架大大增加了机器人学习的数据量。

“这两个框架相结合,可以为人工智能辅助人工执行任务提供机制,我们可以让人类远离危险的环境,同时保持相似的任务执行水平,”博士后研究员Animesh Garg表示,该团队成员认为开发了框架。

该团队设想机器人将成为未来日常生活中不可或缺的一部分:帮助做家务,在制造过程中执行重复的装配任务或完成可能对人类构成威胁的危险任务。

“你不应该告诉机器人将手臂扭转20度,向前扭转10厘米,”朱说。“你希望能够告诉机器人去厨房吃苹果。”

RoboTurk和SURREAL团队的现任成员包括Ajay Mandlekar,Yuke Zhu,Linxi Fan,Animesh Garg以及教师Lii-Fei Li和Silvio Savarese。