今天我们使用的许多产品主要由机器人制造——具有多个自由度的机械臂沿着传送带精确同步运动。这些运动通常需要人工编程,耗时数百到数千小时。谷歌DeepMind团队开发了一个名为RoboBallet的AI系统,让制造机器人能够自主决定如何完成工作。
规划制造机器人如何高效完成工作是一个极难自动化的问题。你需要同时解决任务分配和调度问题——决定哪个机器人以什么顺序完成哪项任务。这就像加强版的著名旅行商问题。此外,还有运动规划问题;你需要确保所有机械臂不会相互碰撞或与周围设备发生碰撞。
最终,你面对的是无数种可能的组合,需要同时解决三个计算上的难题。"有一些工具可以自动化运动规划,但任务分配和调度通常需要手动完成,"谷歌DeepMind研究工程师Matthew Lai说道。"同时解决这三个问题就是我们在工作中要解决的挑战。"
Lai的团队首先生成被称为工作单元的模拟样本,这是机器人团队对制造产品执行任务的区域。工作单元包含一个工件——机器人要处理的产品,在这种情况下是放在桌子上由铝支柱构成的结构。桌子周围最多有八个随机放置的Franka Panda机械臂,每个都有7个自由度,需要在工件上完成多达40个任务。每个任务都要求机械臂的末端执行器在正确的角度接近正确支柱上的正确位置,距离不超过2.5厘米,然后停留片刻。这个暂停模拟了实际工作过程。
为了增加难度,团队在每个工作单元中随机放置了机器人必须避开的障碍物。"我们选择最多使用八个机器人,因为这大约是在不让机器人频繁互相阻挡的情况下紧密配合的合理上限,"Lai解释道。强制机器人在工件上执行40个任务也被团队认为代表了真实工厂的要求。
即使使用最强大的强化学习算法,这样的设置也是噩梦般的挑战。Lai和同事们通过将所有内容转换为图形找到了解决办法。
Lai模型中的图形由节点和边组成。机器人、任务和障碍物等都被视为节点。它们之间的关系被编码为单向或双向边。单向边连接机器人与任务和障碍物,因为机器人需要了解障碍物位置以及任务是否完成。双向边连接机器人彼此,因为每个机器人都必须知道其他机器人在每个时间步骤的行为,以避免碰撞或重复任务。
为了读取和理解图形,团队使用了图神经网络,这是一种专门设计用于通过沿连接边传递消息来提取节点间关系的人工智能。这简化了数据,使研究人员能够设计一个专注于最重要事项的系统:找到在避开障碍物的同时完成任务的最高效方式。在使用单个Nvidia A100 GPU对随机生成的工作单元进行几天训练后,这个名为RoboBallet的新工业规划AI能够在几秒钟内为复杂的、以前从未见过的环境规划出看似可行的轨迹。
最重要的是,它的扩展性非常好。
将传统计算方法应用于管理工厂机器人等复杂问题的困难在于,计算挑战随着系统中项目数量的增加而呈指数级增长。计算一个机器人的最优轨迹相对简单。对两个机器人做同样的事情要困难得多;当数量增长到八个时,问题就变得几乎无法解决了。
使用RoboBallet,计算复杂性也随着系统复杂性增长,但速度要慢得多。(计算随着任务和障碍物数量的增长呈线性增长,随着机器人数量呈二次方增长。)据团队介绍,这些计算应该使系统在工业规模使用中可行。
然而,团队想要测试他们的AI产生的计划是否有效。为了验证这一点,Lai和同事们在几个简化的工作单元中计算了最优任务分配、调度和运动,并与RoboBallet提供的结果进行比较。在执行时间方面——可以说是制造业中最重要的指标——AI非常接近人类工程师的表现。它并不比他们更好——只是提供答案更快。
团队还在四个Panda机器人处理铝工件的真实物理设置上测试了RoboBallet计划,效果与模拟中一样好。但Lai说它能做的不仅仅是加速机器人编程过程。
根据DeepMind团队的说法,RoboBallet还能帮助我们设计更好的工作单元。"因为它工作速度很快,设计师几乎可以实时尝试不同的布局以及不同的机器人放置或选择,"Lai说。这样,工厂的工程师就能准确看到通过向单元添加另一个机器人或选择不同类型的机器人能节省多少时间。RoboBallet能做的另一件事是即时重新编程工作单元,当其中一个机器人故障时让其他机器人填补空缺。
尽管如此,在RoboBallet能够进入工厂之前,仍有一些问题需要解决。"我们做了几个简化,"Lai承认。首先是障碍物被分解为长方体。甚至工件本身也是立方体的。虽然这在某种程度上代表了真实工厂中的障碍物和设备,但有很多可能的工件具有更有机的形状。"最好以更灵活的方式表示这些,比如网格图或点云,"Lai说。然而,这可能意味着RoboBallet惊人速度的下降。
另一个问题是Lai实验中的机器人是相同的,而在真实世界的工作单元中,机器人团队通常是异构的。"这就是为什么真实世界的应用需要针对特定应用类型进行额外研究和工程开发,"Lai说。不过他补充说,当前的RoboBallet已经设计时考虑了这样的适应性——可以轻松扩展以支持它们。一旦完成这些,他希望这将使工厂更快、更灵活。
"系统需要获得工作单元模型、工件模型以及需要完成的任务列表——基于这些,RoboBallet将能够生成完整计划,"Lai说。
Q&A
Q1:RoboBallet是什么?它能解决哪些问题?
A:RoboBallet是谷歌DeepMind开发的AI系统,专门用于制造机器人的自主协调。它能同时解决任务分配、调度和运动规划三个难题,让制造机器人自主决定如何高效完成工作,避免传统需要数百到数千小时人工编程的问题。
Q2:RoboBallet如何处理多机器人协调问题?
A:RoboBallet将机器人、任务和障碍物转换为图形结构,使用图神经网络分析节点间关系。通过单向和双向边连接,机器人能了解障碍物位置、任务状态和其他机器人行为,从而避免碰撞和重复任务,实现高效协调。
Q3:RoboBallet的扩展性如何?能应用到实际工厂吗?
A:RoboBallet具有良好的扩展性,计算复杂性随任务和障碍物线性增长,随机器人数量二次方增长,远优于传统方法的指数增长。团队已在真实四机器人设置中验证其有效性,但仍需解决异构机器人和复杂形状工件等问题才能全面工厂应用。
好文章,需要你的鼓励
OpenAI发布ChatGPT新功能Pulse,可在用户睡眠期间生成个性化报告,提供5-10条简报帮助用户快速了解当日重要信息。该功能旨在让用户像查看社交媒体一样优先使用ChatGPT。Pulse首先向每月200美元的Pro订阅用户开放,未来计划扩展至所有用户。功能支持连接Gmail、日历等应用,可解析邮件、生成日程安排。报告以卡片形式展示,包含AI生成的图像和文本,涵盖新闻摘要、个性化建议等内容。
这项由谷歌DeepMind研究团队完成的开创性研究首次系统阐述了AI智能体经济的概念框架。研究提出"沙盒经济"模型,从起源性质和边界渗透性两个维度分析AI智能体经济形态,预测未来将出现自然涌现且高度透水的AI经济网络。研究详细探讨了科学加速、机器人协调、个人助手等应用场景,提出基于拍卖机制的公平资源分配方案和使命经济概念,并深入分析了技术基础设施需求、社区货币应用以及相关风险防范措施。
AI平台公司Clarifai发布新推理引擎,声称能让AI模型运行速度提升一倍,成本降低40%。该系统采用多种优化技术,从CUDA内核到高级推测解码,能在相同硬件上获得更强推理性能。第三方测试显示其在吞吐量和延迟方面创下行业最佳记录。该产品专门针对推理过程优化,特别适用于需要多步骤响应的智能体和推理模型。
中国人民大学研究团队提出LoFT方法,通过参数高效微调基础模型解决长尾半监督学习中的数据不平衡问题。该方法利用预训练模型的良好校准特性改进伪标签质量,并扩展出LoFT-OW版本处理开放世界场景。实验显示,仅使用传统方法1%的数据量就能取得更优性能,为AI公平性和实用性提供了新的解决方案。