“世界需要机器人”这是英伟达CEO黄仁勋在谈及未来技术趋势时反复强调的一点。随着全球技术的快速推进与社会结构的变化,通用人形机器人的发展正成为解决关键社会问题的一个重要途径。在他看来,机器人不仅是技术进步的象征,同时也是未来世界的迫切需求。

黄仁勋指出,制造通用人形机器人的技术是“我们当今时代最重要的一项技术挑战”,其中,Transformer架构、大语言模型以及基础模型等创新为人形机器人的实现创造了可能。他认为,“这是人类第一次拥有了能够大幅推动这一领域技术的能力”。目前,我们面临着老龄化加剧、人口出生率下降以及人类对工作类型偏好的变化导致劳动力不足的问题,而机器人将成为填补这一缺口的关键。人形机器人的意义尤其重大,因为我们生活的世界从一开始就是围绕人类而建构的,这类机器人最能无缝地融入社会。
然而,机器人无法简单地被制造出来,它们需要能够“理解”人类和世界。如今,像ChatGPT这样的语言模型已经使我们迈出了重要一步,将自然语言的理解从梦想带入了现实。但对于机器人来说,这还远远不够。“它们还需要理解物理世界的动态机制,比如重力、摩擦、空间关系、几何关系,甚至像对象的永久存在性这样的人类常识。”这一点非常关键。为了解决这个问题,英伟达提出了世界基础模型(World Foundation Model)的概念。而Cosmos正是这一基础模型的实现形式,黄仁勋表示,如果说ChatGPT及类似的大语言模型让AI理解了文字和语言,那么Cosmos的使命就是让AI理解世界本身的物理规律和动态机制。
黄仁勋进一步阐述了机器人技能学习的难点,以及如何通过创新手段突破这些障碍。“教导人形机器人某个技能的方法其实有点像教导人类,我们会通过示范告诉它,这样拿起一个玻璃杯是正确的姿势。可是玻璃杯的大小、形状、位置总是在变化。但对于机器人来说,任务的本质是‘拿起玻璃杯’。”通过英伟达的Isaac Gym和Omniverse模拟环境,这种技能的训练效率可以获得极大的提升。在虚拟平台中,研究者只需完成少量的人类示范,AI会根据这些示范生成无数个变量场景,机器人借助这些变体,能够学习各种可能情况的“拿起玻璃杯”动作,而不是局限于单一的操作方法。

Omniverse不仅提供了一个完全遵循物理规律的虚拟世界环境,还可以让机器人快速并行地进行训练。“如果让机器人在现实中学会行走,需要以正常的‘人类时间’进行线性学习。但在Omniverse中,我们可以同时训练无数个机器人,让它们在10万种不同的环境中完成同一个任务。”黄仁勋表示,这种通过虚拟世界模拟的“多元宇宙”训练能够将原本需要十年的学习过程缩短到数小时。更重要的是,机器人在虚拟世界中的学习能力可以无缝迁移到现实世界,当训练完成后,他们会将机器人大脑“转移”到实体机器人中。
人工智能和机器人的结合不仅解决了技术难题,也为社会前进、解决人口老龄化和劳动力短缺提供了一条创新的路径。像Omniverse和Cosmos这样的开放平台,通过创造虚拟的“多元宇宙”供机器人学习,进一步加快了这一愿景的实现。黄仁勋认为,机器人和人工智能将在未来十年内成为整个科学技术体系的重要支柱,这些技术不再是遥远的未来,而是触手可及的现在,一场新的工业革命已经启动。
参考资料:https://www.youtube.com/watch?v=Z_DR1_zhmCU
好文章,需要你的鼓励
开源工作流自动化平台n8n发布安全警告,披露一个CVSS评分10.0分的最高危漏洞CVE-2026-21877。该漏洞可能导致经过身份验证的用户执行远程代码,造成受影响实例的完全妥协。漏洞影响0.123.0至1.121.3之间的版本,包括自托管部署和云实例。官方已在1.121.3版本中修复此问题,建议用户立即升级。
上海AI实验室开发RePro训练方法,通过将AI推理过程类比为优化问题,教会AI避免过度思考。该方法通过评估推理步骤的进步幅度和稳定性,显著提升了模型在数学、科学和编程任务上的表现,准确率提升5-6个百分点,同时大幅减少无效推理,为高效AI系统发展提供新思路。
Veeam发布安全更新,修复其备份与复制软件中的多个漏洞,包括一个可导致远程代码执行的严重问题。CVE-2025-59470漏洞CVSS评分达9.0分,允许备份或磁带操作员通过发送恶意参数执行远程代码。此外还修复了三个其他漏洞,涉及配置文件攻击和文件写入权限提升等问题。所有漏洞影响13.0.1.180及更早版本,已在13.0.1.1071版本中修复。
MIT团队开发的VLASH技术首次解决了机器人动作断续、反应迟缓的根本问题。通过"未来状态感知"让机器人边执行边思考,实现了最高2.03倍的速度提升和17.4倍的反应延迟改善,成功展示了机器人打乒乓球等高难度任务,为机器人在动态环境中的应用开辟了新可能性。