我们通常只能在游戏和电影中见到机器管家,但来自斯坦福大学的一支团队向我们介绍了 Mobile ALOHA 系统,这将让机器人管家离我们越来越近。
Mobile ALOHA 并不是一个机器人,而是一个操作系统。借助这个系统,机器人可以轻松完成各种精细工作,比如煎蘑菇:
除了简单的“白人饭”,即使是“干贝烧鸡”“蚝油生菜”这种复杂的中餐,机器人也可以轻松地自己完成。比如打鸡蛋:
给虾仁焯水:
炒菜:
在Mobile ALOHA的加持下,机器人还可以完成各种复杂的工作,比如洗碗:
把椅子归位:
擦桌子:
把锅放进储物柜:
坐电梯:
还能和人击掌:
此外,人们还可以利用 Mobile ALOHA遥控机器人完成擦玻璃,扫厕所等精细的家务。
从各种动图中不难看出,在 Mobile ALOHA 系统的加持下,机器人可以非常顺滑地完成各种家务和复杂的任务。
那么,这个Mobile ALOHA 究竟是什么呢?
按照斯坦福大学研究团队的说法,Mobile ALOHA 是一个低成本的移动操作平台,它结合了ALOHA系统的双手操纵能力与移动底座的移动性。这个系统的设计目标是使机器人能够执行复杂的移动操作任务,同时保持低成本和易于操作的特点。
使用Mobile ALOHA收集的数据,研究人员进行了监督行为克隆,并发现与现有的静态ALOHA数据集共同训练可以显著提高移动操作任务的性能。即使只有50个任务演示,共同训练也可以将成功率提高多达90%,使Mobile ALOHA能够自主完成复杂的移动操作任务,如炒虾、打开双门橱柜存放重锅、呼叫电梯以及使用厨房水龙头轻轻冲洗用过的平底锅。
Mobile ALOHA 基于ALOHA系统实现,这是一款低成本的双手操纵装置,Mobile ALOHA 则在此基础上增加了远程控制系统。为了实现远程操控的功能,研究者将其安装在一个轮式底座上,赋予机器人接近人类的移动速度。系统还包括了两个手腕摄像头和一个顶部摄像头,用于捕捉操作过程中的视觉信息。此外,系统还具备了机载电源和计算能力,使得它在没有外部电源的情况下也能连续工作多小时。
除了这些基础硬件之外,研究团队还设计了一个将操作者的身体与机器人底座相连的系统。操作者通过背带与底座相连,并通过拉动底座来控制机器人的移动。这种设计允许操作者在控制机器人的移动的同时,用双手操纵ALOHA的双臂。
通过这些接口,研究团队收集了大量的操作数据。这些数据包括机器人底座的线性和角速度,以及机器人双臂的关节位置。这些数据被用来训练模仿学习算法,以学习如何执行复杂的移动操作任务。
之后,研究者使用了监督行为克隆(Supervised Behavior Cloning)的方法来训练机器人。他们首先将机器人的关节位置和底座的速度作为动作向量,然后将这些动作向量与机器人的观察(包括摄像头图像和关节位置)结合起来,形成一个16维的动作向量。这种方法使得Mobile ALOHA能够直接从之前的深度模仿学习算法中受益,几乎不需要改变实现策略。
为了提高模仿学习的性能,研究者采用了共同训练的方法。他们将Mobile ALOHA收集的数据与现有的静态ALOHA数据集结合起来进行训练。这种共同训练的方法在几乎所有的移动操作任务中都显示出了正向转移,即使在任务和形态上有所不同的情况下,也能实现等效或更好的性能和数据效率。
通过这些实现原理,Mobile ALOHA系统能够在有限的演示数据下,通过模仿学习掌握复杂的移动操作任务。这种低成本的解决方案为研究者提供了一个实用的平台,用于研究和开发能够在家庭环境中执行实用任务的机器人。
值得一提的是,该团队还公布了Mobile ALOHA系统的成本。整套系统的总价只要不到32000美元,包括机器人硬件、电源和计算设备、摄像头、传感器、组装和维护费用以及开源的软件部分。
Mobile ALOHA 为机器人学习和移动操作研究提供了一个经济高效的解决方案,使得更多的研究者和开发者能够参与到这一领域中来。
尽管 Mobile ALOHA 在硬件和软件方面都取得了显著进展,但该团队也表示,Mobile ALOHA 仍存在一些限制,例如系统占用面积较大,固定高度的双臂难以触及较低的橱柜、烤箱和洗碗机等。未来他们的工作将致力于解决这些硬件限制,并探索如何从高度次优的、异构的数据集中进行模仿学习。
Mobile ALOHA 项目目前已经在 Github上开源,团队也放出了相应的论文和介绍。这项技术还不够成熟,研发者还表示将会在不久之后在 Arxiv 平台发布更详细的论文,GenAI 也将会继续关注技术细节,有新消息会第一时间解读。
论文地址:https://mobile-aloha.github.io/resources/mobile-aloha.pdf
Github页面:https://mobile-aloha.github.io/
本文来自微信公众号:GenAI新世界(ID:gh_e06235300f0d),作者:吕可