在2026年国际消费电子展(CES)上,英伟达发布了Alpamayo,这是一个全新的开源AI模型系列,包含仿真工具和数据集,专门用于训练物理机器人和车辆,旨在帮助自动驾驶汽车在复杂驾驶环境中进行推理。
"物理AI的ChatGPT时刻已经到来——机器开始理解、推理并在现实世界中行动,"英伟达首席执行官黄仁勋在声明中表示。"Alpamayo为自动驾驶汽车带来了推理能力,使它们能够思考罕见场景,在复杂环境中安全驾驶,并解释它们的驾驶决策。"
核心模型Alpamayo 1
英伟达新系列的核心是Alpamayo 1,这是一个拥有100亿参数的思维链、基于推理的视觉语言动作(VLA)模型,允许自动驾驶汽车像人类一样思考,从而解决复杂的边缘情况——比如如何在繁忙十字路口处理交通信号灯故障——而无需先前经验。
"它通过将问题分解为步骤,推理每种可能性,然后选择最安全的路径来实现这一点,"英伟达汽车副总裁阿里·卡尼在周一的新闻发布会上说。
正如黄仁勋在周一的主题演讲中所说:"Alpamayo不仅接收传感器输入并激活方向盘、制动器和加速器,它还会推理即将采取的行动。它会告诉你将要采取什么行动,得出该行动的原因。当然,还有轨迹。"
开放生态系统和开发工具
Alpamayo 1的底层代码可在Hugging Face上获得。开发者可以将Alpamayo微调为更小、更快的版本用于车辆开发,用它来训练更简单的驾驶系统,或在其上构建工具,如自动标记视频数据的自动标注系统或检查汽车是否做出明智决策的评估器。
"他们还可以使用Cosmos生成合成数据,然后在真实和合成数据集的组合上训练和测试基于Alpamayo的自动驾驶应用,"卡尼说。Cosmos是英伟达的生成式世界模型品牌,这是一种AI系统,可以创建物理环境的表示,从而进行预测和采取行动。
数据集和仿真框架
作为Alpamayo推出的一部分,英伟达还发布了一个开放数据集,包含超过1700小时跨各种地理位置和条件收集的驾驶数据,涵盖罕见和复杂的现实世界场景。该公司还推出了AlpaSim,这是一个用于验证自动驾驶系统的开源仿真框架。AlpaSim在GitHub上可用,旨在重现真实世界的驾驶条件,从传感器到交通,让开发者可以安全地大规模测试系统。
Q&A
Q1:Alpamayo是什么?它有什么特殊能力?
A:Alpamayo是英伟达推出的开源AI模型系列,专门用于自动驾驶汽车训练。其核心模型Alpamayo 1是一个100亿参数的视觉语言动作模型,能让自动驾驶汽车像人类一样思考和推理,处理复杂的驾驶场景,比如交通信号灯故障等边缘情况。
Q2:Alpamayo 1是如何工作的?
A:Alpamayo 1通过将复杂问题分解为步骤,推理每种可能性,然后选择最安全的路径来工作。它不仅能接收传感器输入并控制车辆操作,还能推理即将采取的行动,解释决策原因,并规划行驶轨迹。
Q3:开发者如何使用Alpamayo进行开发?
A:开发者可以从Hugging Face获得Alpamayo 1的底层代码,将其微调为更适合的版本,或在其上构建各种工具。英伟达还提供了超过1700小时的开放驾驶数据集和AlpaSim开源仿真框架,帮助开发者训练和测试自动驾驶系统。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。