在2026年国际消费电子展(CES)上,英伟达发布了Alpamayo,这是一个全新的开源AI模型系列,包含仿真工具和数据集,专门用于训练物理机器人和车辆,旨在帮助自动驾驶汽车在复杂驾驶环境中进行推理。
"物理AI的ChatGPT时刻已经到来——机器开始理解、推理并在现实世界中行动,"英伟达首席执行官黄仁勋在声明中表示。"Alpamayo为自动驾驶汽车带来了推理能力,使它们能够思考罕见场景,在复杂环境中安全驾驶,并解释它们的驾驶决策。"
核心模型Alpamayo 1
英伟达新系列的核心是Alpamayo 1,这是一个拥有100亿参数的思维链、基于推理的视觉语言动作(VLA)模型,允许自动驾驶汽车像人类一样思考,从而解决复杂的边缘情况——比如如何在繁忙十字路口处理交通信号灯故障——而无需先前经验。
"它通过将问题分解为步骤,推理每种可能性,然后选择最安全的路径来实现这一点,"英伟达汽车副总裁阿里·卡尼在周一的新闻发布会上说。
正如黄仁勋在周一的主题演讲中所说:"Alpamayo不仅接收传感器输入并激活方向盘、制动器和加速器,它还会推理即将采取的行动。它会告诉你将要采取什么行动,得出该行动的原因。当然,还有轨迹。"
开放生态系统和开发工具
Alpamayo 1的底层代码可在Hugging Face上获得。开发者可以将Alpamayo微调为更小、更快的版本用于车辆开发,用它来训练更简单的驾驶系统,或在其上构建工具,如自动标记视频数据的自动标注系统或检查汽车是否做出明智决策的评估器。
"他们还可以使用Cosmos生成合成数据,然后在真实和合成数据集的组合上训练和测试基于Alpamayo的自动驾驶应用,"卡尼说。Cosmos是英伟达的生成式世界模型品牌,这是一种AI系统,可以创建物理环境的表示,从而进行预测和采取行动。
数据集和仿真框架
作为Alpamayo推出的一部分,英伟达还发布了一个开放数据集,包含超过1700小时跨各种地理位置和条件收集的驾驶数据,涵盖罕见和复杂的现实世界场景。该公司还推出了AlpaSim,这是一个用于验证自动驾驶系统的开源仿真框架。AlpaSim在GitHub上可用,旨在重现真实世界的驾驶条件,从传感器到交通,让开发者可以安全地大规模测试系统。
Q&A
Q1:Alpamayo是什么?它有什么特殊能力?
A:Alpamayo是英伟达推出的开源AI模型系列,专门用于自动驾驶汽车训练。其核心模型Alpamayo 1是一个100亿参数的视觉语言动作模型,能让自动驾驶汽车像人类一样思考和推理,处理复杂的驾驶场景,比如交通信号灯故障等边缘情况。
Q2:Alpamayo 1是如何工作的?
A:Alpamayo 1通过将复杂问题分解为步骤,推理每种可能性,然后选择最安全的路径来工作。它不仅能接收传感器输入并控制车辆操作,还能推理即将采取的行动,解释决策原因,并规划行驶轨迹。
Q3:开发者如何使用Alpamayo进行开发?
A:开发者可以从Hugging Face获得Alpamayo 1的底层代码,将其微调为更适合的版本,或在其上构建各种工具。英伟达还提供了超过1700小时的开放驾驶数据集和AlpaSim开源仿真框架,帮助开发者训练和测试自动驾驶系统。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。