机器人初创公司Physical Intelligence:新模型能完成从未训练过的任务

旧金山机器人初创公司Physical Intelligence发布最新研究成果,其新模型π0.5能够指导机器人完成从未接受过专项训练的任务,展现出"组合泛化"能力。该模型可融合不同场景中习得的技能,应对全新挑战。测试中,机器人仅凭极少训练数据便学会使用空气炸锅烹饪食物。研究人员表示,这一结果令自身深感意外,或预示着机器人AI正接近类似大语言模型的能力跃升拐点。

Physical Intelligence是一家成立两年、总部位于旧金山的机器人初创公司,已悄然成为湾区最受瞩目的AI企业之一。该公司于近日发布了最新研究成果,表明其新模型能够引导机器人完成从未经过专项训练的任务——这一能力甚至让公司自己的研究人员感到意外。

这款名为π0.7的新模型,代表着该公司朝着通用机器人"大脑"这一长期目标迈出的早期但重要一步:机器人面对陌生任务时,只需通过自然语言指引便能真正完成操作。如果研究结论经得起推敲,则意味着机器人AI或正在逼近一个类似大语言模型当年的关键拐点——能力开始以超出训练数据预期的速度复合增长。

组合泛化能力:打破"死记硬背"的训练范式

这项研究的核心主张是"组合泛化"——即将在不同情境中习得的技能进行组合,从而解决模型从未遇到过的新问题。长期以来,机器人训练的标准做法本质上是死记硬背:针对某项特定任务收集数据,训练专用模型,然后对每项新任务重复此流程。Physical Intelligence表示,π0.7打破了这一模式。

公司联合创始人、加州大学伯克利分校机器人AI教授谢尔盖·莱文(Sergey Levine)表示:"一旦模型跨越那个临界点——从只会执行已收集数据对应的任务,到真正以新方式重新组合运用这些技能——其能力提升将超越与数据量成线性增长的速度。这种更为优越的扩展特性,我们在语言和视觉等其他领域也曾观察到过。"

空气炸锅实验:令研究人员惊叹的意外能力

论文中最引人注目的演示,涉及一台模型在训练中几乎从未接触过的空气炸锅。研究团队调查后发现,整个训练数据集中仅有两段相关记录:一段是另一台机器人将空气炸锅盖推上,另一段来自开源数据集,记录了某台机器人按照指令将塑料瓶放入空气炸锅。而该模型竟能将这些零散片段与更广泛的网络预训练数据融合,形成对这台电器工作原理的实用性理解。

Physical Intelligence研究科学家、斯坦福大学计算机科学博士阿什温·巴拉克里希纳(Ashwin Balakrishna)坦言:"很难追溯知识究竟从何而来,也难以预判模型在哪些地方会成功或失败。"尽管如此,在零引导的情况下,该模型尝试用空气炸锅烹饪红薯,结果尚算过得去;而在逐步口头指导下——就像向新员工解释操作步骤那样——机器人则顺利完成了任务。

这种语言指导能力之所以重要,在于它意味着机器人可以在全新环境中部署,并通过实时指令改善表现,无需重新收集数据或重新训练模型。

局限性与失败案例:研究团队坦诚自我批评

研究人员并不回避模型的局限性,也未过度渲染研究成果。在至少一个案例中,他们将矛头直接指向了自身团队。

巴拉克里希纳说:"有时候失败不在于机器人或模型本身,而在于我们——我们不擅长提示词工程。"他描述了一次早期空气炸锅实验,成功率仅为5%。在花了大约半小时优化任务描述方式之后,成功率一跃升至95%。

该模型目前也尚不具备从单一高层指令出发、自主执行复杂多步骤任务的能力。莱文表示:"你不能直接告诉它'帮我做片吐司'。但如果逐步引导它——'对于烤面包机,先打开这个部分,按下那个按钮,再做这一步'——它通常就能顺利完成。"

研究团队同时承认,机器人领域目前缺乏标准化的评测基准,这使得外部验证其研究结论颇为困难。对此,公司转而将π0.7与自身此前的专用模型进行比较——这些专用模型是针对单一任务训练的专项系统——结果显示,通用模型在制作咖啡、折叠衣物、组装纸箱等一系列复杂任务中均能与之媲美。

超出预期的能力:研究者眼中最珍贵的惊喜

如果说这项研究有什么最值得关注之处,那或许不是某个具体的演示,而是结果令研究人员——那些对训练数据了如指掌的专业人士——感到真正意外的程度。

"我以前的经验一向是:只要深入了解数据内容,就能大致判断模型能做什么,"巴拉克里希纳说,"我几乎从不会感到惊讶。但过去几个月是我第一次真正感到震惊。我随手买了一套齿轮,问机器人'你能转动这个齿轮吗?'它就直接做到了。"

莱文回忆起研究人员第一次看到GPT-2生成一篇关于安第斯山脉独角兽故事时的情景:"它到底是从哪里学来秘鲁独角兽的?这种组合太奇特了。我认为,在机器人领域看到类似现象,真的意义非凡。"

当然,批评者会指出一个显而易见的不对等之处:大语言模型可以从整个互联网中汲取知识,而机器人没有这种条件,再聪明的提示词也无法完全弥补这一差距。但面对质疑,莱文的回应却指向另一个方向。

"对任何机器人泛化演示,人们总能提出一个批评:任务太无聊了,机器人又没在做后空翻。"他反驳了这种逻辑框架,认为令人眼前一亮的机器人演示与真正具备泛化能力的机器人系统之间的区别,恰恰就是问题的核心所在。他认为,泛化能力看起来永远不如精心编排的技巧性表演那样震撼,但其实用价值要高得多。

论文本身在措辞上保持审慎,将π0.7描述为展现出泛化能力的"初步迹象"与新能力的"初步演示"。这些是研究成果,而非已上市产品。Physical Intelligence从一开始便对商业化时间表保持克制态度。当被直接问及基于这些研究成果的系统何时能够准备好实际部署时,莱文拒绝猜测:"我认为有充分理由保持乐观,进展速度也确实比我几年前预期的要快。但这个问题真的很难回答。"

融资规模持续扩大:估值或将突破百亿美元

Physical Intelligence迄今已累计融资超过10亿美元,最新估值达56亿美元。投资者热情的重要来源之一,是联合创始人拉奇·格鲁姆(Lachy Groom)。他曾是硅谷最受认可的天使投资人之一,投资过Figma、Notion、Ramp等知名企业,之后认定Physical Intelligence正是他一直在寻找的公司。这一背景帮助该初创公司吸引了大量机构资本,尽管它拒绝向投资者提供商业化时间表。目前,该公司据悉正在洽谈新一轮融资,若成功完成,估值将接近翻倍,达到110亿美元。公司团队对此拒绝置评。

Q&A

Q1:π0.7模型的"组合泛化"能力是什么意思?

A:组合泛化是指模型能够将在不同场景中分别学到的技能进行重新组合,从而解决从未在训练数据中出现过的新任务。过去机器人训练是"一事一练"的专项模式,而π0.7可以融合零散知识片段,配合语言指令完成陌生任务,这标志着机器人AI从专用走向通用的重要转变。

Q2:π0.7目前有哪些明显的局限性?

A:目前π0.7还不能从单一高层指令出发自主完成复杂多步骤任务,比如无法直接听懂"帮我做吐司"这类命令。此外,模型的成功率高度依赖提示词的质量,研究人员曾通过优化任务描述将成功率从5%提升到95%。机器人领域也缺乏统一的评测基准,外部验证较为困难。

Q3:Physical Intelligence目前的融资和估值情况如何?

A:Physical Intelligence迄今已累计融资超过10亿美元,最新估值为56亿美元。目前公司正在洽谈新一轮融资,若完成,估值将接近翻倍至约110亿美元。尽管公司拒绝提供明确的商业化时间表,联合创始人格鲁姆的天使投资背景仍为其吸引了大量机构资本。

来源:Techcrunch

0赞

好文章,需要你的鼓励

2026

04/17

16:41

分享

点赞

邮件订阅