Nvidia CEO Jensen Huang 在周二的 GTC 2025 大会上宣布,Nvidia 正与迪士尼研究院和 Google DeepMind 合作开发 Newton,这是一个用于模拟机器人在真实环境中运动的物理引擎。
迪士尼将成为首批使用 Newton 来驱动其下一代娱乐机器人的公司之一,比如星球大战主题的 BDX 机器人——在 Huang 周二的主题演讲中,其中一个机器人就在他身边摇摆行走。
Nvidia 计划在 2025 年晚些时候发布 Newton 的早期开源版本。
在 GTC 2025 大会上,Nvidia CEO Jensen Huang 展示了 Groot N1,这是一个为人形机器人开发的通用基础模型,并在迪士尼的 BDX 机器人上进行了演示。
多年来,迪士尼一直在推广将这些受星球大战启发的机器人引入其全球主题公园的想法。此前已经进行了多次受控演示,最近一次是在 SXSW 2025。现在——部分得益于 Newton 的支持——迪士尼认为这项技术已经成熟,并计划从明年开始在多个主题公园展示这些机器人。
在新闻稿中,迪士尼 Imagineering 高级副总裁 Kyle Laughlin 表示,与 Nvidia 和 Google DeepMind 的合作将在推动未来迪士尼娱乐机器人发展方面发挥关键作用。
据 Nvidia 表示,Newton 旨在帮助机器人变得更加"富有表现力",并"学会如何更精确地处理复杂任务"。这个物理引擎的设计目的是帮助开发者模拟机器人与自然世界的互动,这往往是机器人开发者面临的一大挑战。
Nvidia 声称 Newton 具有高度可定制性。例如,开发者可以使用它来编程机器人与食物、布料、沙子和其他可变形物体的交互。
Newton 将与 Google DeepMind 的机器人开发工具生态系统兼容,包括其物理引擎 MuJoCo,后者可以模拟多关节机器人运动。
Newton 是 Nvidia 在 GTC 2025 开幕周发布的众多公告之一。公司还发布了人形机器人 AI 基础模型 Groot N1,据称可以让机器人更好地感知和理解周围环境。此外,公司还公布了下一代 AI 芯片的发展时间表,包括 Blackwell Ultra 和 Rubin,并推出了新的"个人 AI 计算机"产品线。
好文章,需要你的鼓励
OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植入生成场景中,并可与朋友分享形象使用权限。该iOS应用目前在美加地区采用邀请制,ChatGPT Pro用户可直接体验。
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
大语言模型和生成式AI自诞生以来问题频发,从推理模型表现不佳到AI幻觉现象,再到版权诉讼,这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为,仅靠增加数据和算力的扩展模式已显现边际效应递减,无法实现通用人工智能。研究者提出智能应包含统计、结构、推理和目标四个层次的协调,并强调时间因果性的重要性。面对LLM技术局限,业界开始探索神经符号AI等替代方案。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。