从表面上看,能够处理各种任务的人形机器人似乎已经近在眼前——尤其是当科技公司展示它们完成高难度动作或承担家务劳动时。然而,这些机器人演示与它们在真实世界中能够可靠、反复地完成同类任务之间,仍然存在相当大的差距。
最新一波机器人视频之所以格外容易让人产生误解,与人类天生倾向于对具有人形外观的物体进行拟人化解读密切相关。Agility Robotics联合创始人、俄勒冈州立大学机器人研究员乔纳森·赫斯特表示,一只机械臂做出舞蹈动作可能只是看起来"很酷",但一台人形机器人做出同样的动作,却会引发更多具有误导性的联想。
"人们会自动进行推断,认为一个看起来像人的机器人能够完成一个会跳舞的人所能做的一切——但事实并非如此,"赫斯特在接受采访时表示,"但很多初创公司确实在利用这一点来募集大量资金。"
加州大学伯克利分校计算机科学家、AI与机器人公司Physical Intelligence联合创始人谢尔盖·列文指出,当前机器人领域面临的最大挑战之一,是如何开发出能够像人类一样在不同条件和环境下举一反三、灵活应对的机器人。而这种程度的泛化能力,几乎不可能通过一次机器人演示来体现。
"也许机器人能够倒一杯葡萄酒,但它能从任意一瓶酒倒入任意一只杯子,并在任何环境中完成这个动作吗?"列文说,"这实际上远比让机器人在某个固定舞台上完成后空翻要难得多。"
列文解释说,衡量机器人真实能力的标准,在于在真实环境中开展"大规模量化评估"。"演示中能展示的内容,与机器人的真实能力之间,始终存在差距,"他说。
观看视频时需注意什么
在观看数量激增的机器人演示视频乃至直播时,有几点值得特别留意。普渡大学计算机科学博士候选人、美国陆军DevCom陆军研究实验室研究助理迪帕姆·帕特尔表示,首先,机器人演示并不一定意味着机器人是在没有人工控制或监督的情况下自主运行的。许多演示仍依赖人工操作员通过远程操控方式直接控制机器人的动作。
"除非研究论文或公司明确说明机器人是完全自主运行的,否则你应该对此保持高度怀疑,"帕特尔在接受采访时说。
另一个值得关注的问题是:演示中的机器人是在完全陌生的全新测试环境中首次执行任务,还是仅仅在它已经熟悉的训练环境中重复已掌握的动作?帕特尔表示,前者更能有效证明机器人具备在泛化场景下自主执行任务的能力,因而更具说服力。
帕特尔还建议留意机器人演示视频的播放速度,因为"出于安全等方面的考量,机器人通常运动很慢"。公司有时会注明演示视频以两倍或四倍速度播放——这意味着机器人完成同一任务实际上需要人类两倍甚至四倍的时间。
此外,机器人演示视频在信息价值和透明度方面也存在很大差异。有些视频显然是为了在社交媒体上引发传播而制作的表演性娱乐内容,或者是企业为吸引客户和投资者精心制作的宣传片。另一些视频则会更多呈现机器人训练过程的幕后实况,并如实记录机器人在过程中出现的失误。
但即便一段机器人演示视频出自较具信誉的公司或研究机构,看起来令人印象深刻且真实可信,也请记住,这不过是更大图景中的一个小小缩影。机器人能力真正取得进展的标志,并不那么容易被包装成适合互联网受众消费的内容。
Q&A
Q1:怎么判断一个机器人演示视频是真实能力还是"表演"?
A:可以从几个维度来判断:一是看公司是否明确说明机器人处于完全自主运行状态,而非由人工远程操控;二是观察机器人是否在全新的未知环境中执行任务,而非重复在训练场景中练习过的动作;三是注意视频播放速度是否经过加速处理。如果以上信息均未披露,建议对视频保持审慎态度。
Q2:人形机器人和普通机械臂在给观众的观感上有什么本质区别?
A:人形机器人更容易触发观众的拟人化联想。Agility Robotics联合创始人乔纳森·赫斯特指出,当机械臂做出舞蹈动作时,人们只会觉得"很酷";但当人形机器人做出同样动作时,人们会下意识地认为它具备人类的全部能力,而这种推断往往并不成立。部分初创公司正是利用这一心理偏差来吸引投资。
Q3:目前衡量机器人真实能力的标准是什么?
A:据Physical Intelligence联合创始人谢尔盖·列文介绍,衡量机器人真实能力的关键在于在真实世界中开展"大规模量化评估",而非依赖单次演示。单次演示只能呈现有限场景,而真正的能力验证需要机器人在多种不同条件和环境下持续稳定地完成任务,这与人类的泛化能力相近,也是当前机器人领域尚未完全攻克的核心难题。
好文章,需要你的鼓励
今天讲的出海案例是明阳电气,这家输配电设备公司在马来西亚投产首个海外生产基地,并以 250 万林吉特子公司承接本地制造。
阿里巴巴通义实验室与北京大学联合提出ESPO方法,让语言模型强化学习训练时能在推理走偏时及时截断,节省超20%计算资源,同步提升数学推理准确率。
Canva正式发布适用于Perplexity Computer平台的连接器,允许Perplexity桌面智能代理自主将数据和提示词转化为可编辑的Canva设计资产。用户只需通过连接器页面接入Canva,描述需求,Perplexity便可结合会议记录、业务数据及实时网络内容,自动生成演示文稿、社交媒体素材、信息图表或品牌视觉套件。该功能目前面向Perplexity Pro、Max及企业版用户开放。
NITP是上海交通大学等机构提出的大语言模型预训练新目标,通过让模型预测下一词的浅层语义表示,解决标准训练中内部表示退化问题,仅增加约2%训练开销即可提升下游任务表现。