在2026年国际消费电子展(CES)上,英伟达发布了Alpamayo,这是一个全新的开源AI模型系列,包含仿真工具和数据集,专门用于训练物理机器人和车辆,旨在帮助自动驾驶汽车在复杂驾驶环境中进行推理。
"物理AI的ChatGPT时刻已经到来——机器开始理解、推理并在现实世界中行动,"英伟达首席执行官黄仁勋在声明中表示。"Alpamayo为自动驾驶汽车带来了推理能力,使它们能够思考罕见场景,在复杂环境中安全驾驶,并解释它们的驾驶决策。"
核心模型Alpamayo 1
英伟达新系列的核心是Alpamayo 1,这是一个拥有100亿参数的思维链、基于推理的视觉语言动作(VLA)模型,允许自动驾驶汽车像人类一样思考,从而解决复杂的边缘情况——比如如何在繁忙十字路口处理交通信号灯故障——而无需先前经验。
"它通过将问题分解为步骤,推理每种可能性,然后选择最安全的路径来实现这一点,"英伟达汽车副总裁阿里·卡尼在周一的新闻发布会上说。
正如黄仁勋在周一的主题演讲中所说:"Alpamayo不仅接收传感器输入并激活方向盘、制动器和加速器,它还会推理即将采取的行动。它会告诉你将要采取什么行动,得出该行动的原因。当然,还有轨迹。"
开放生态系统和开发工具
Alpamayo 1的底层代码可在Hugging Face上获得。开发者可以将Alpamayo微调为更小、更快的版本用于车辆开发,用它来训练更简单的驾驶系统,或在其上构建工具,如自动标记视频数据的自动标注系统或检查汽车是否做出明智决策的评估器。
"他们还可以使用Cosmos生成合成数据,然后在真实和合成数据集的组合上训练和测试基于Alpamayo的自动驾驶应用,"卡尼说。Cosmos是英伟达的生成式世界模型品牌,这是一种AI系统,可以创建物理环境的表示,从而进行预测和采取行动。
数据集和仿真框架
作为Alpamayo推出的一部分,英伟达还发布了一个开放数据集,包含超过1700小时跨各种地理位置和条件收集的驾驶数据,涵盖罕见和复杂的现实世界场景。该公司还推出了AlpaSim,这是一个用于验证自动驾驶系统的开源仿真框架。AlpaSim在GitHub上可用,旨在重现真实世界的驾驶条件,从传感器到交通,让开发者可以安全地大规模测试系统。
Q&A
Q1:Alpamayo是什么?它有什么特殊能力?
A:Alpamayo是英伟达推出的开源AI模型系列,专门用于自动驾驶汽车训练。其核心模型Alpamayo 1是一个100亿参数的视觉语言动作模型,能让自动驾驶汽车像人类一样思考和推理,处理复杂的驾驶场景,比如交通信号灯故障等边缘情况。
Q2:Alpamayo 1是如何工作的?
A:Alpamayo 1通过将复杂问题分解为步骤,推理每种可能性,然后选择最安全的路径来工作。它不仅能接收传感器输入并控制车辆操作,还能推理即将采取的行动,解释决策原因,并规划行驶轨迹。
Q3:开发者如何使用Alpamayo进行开发?
A:开发者可以从Hugging Face获得Alpamayo 1的底层代码,将其微调为更适合的版本,或在其上构建各种工具。英伟达还提供了超过1700小时的开放驾驶数据集和AlpaSim开源仿真框架,帮助开发者训练和测试自动驾驶系统。
好文章,需要你的鼓励
随着AI广泛应用推动数据中心建设热潮,运营商面临可持续发展挑战。2024年底美国已建成或批准1240个数据中心,能耗激增引发争议。除能源问题外,服务器和GPU更新换代产生的电子废物同样严重。通过采用模块化可修复系统、AI驱动资产跟踪、标准化数据清理技术以及与认证ITAD合作伙伴合作,数据中心可实现循环经济模式,在确保数据安全的同时减少环境影响。
剑桥大学研究团队首次系统探索AI在多轮对话中的信心判断问题。研究发现当前AI系统在评估自己答案可靠性方面存在严重缺陷,容易被对话长度而非信息质量误导。团队提出P(SUFFICIENT)等新方法,但整体问题仍待解决。该研究为AI在医疗、法律等关键领域的安全应用提供重要指导,强调了开发更可信AI系统的紧迫性。
超大规模云数据中心是数字经济的支柱,2026年将继续保持核心地位。AWS、微软、谷歌、Meta、甲骨文和阿里巴巴等主要运营商正积极扩张以满足AI和云服务需求激增,预计2026年资本支出将超过6000亿美元。然而增长受到电力供应、设备交付和当地阻力制约。截至2025年末,全球运营中的超大规模数据中心达1297个,总容量预计在12个季度内翻倍。
威斯康星大学研究团队开发出Prithvi-CAFE洪水监测系统,通过"双视觉协作"机制解决了AI地理基础模型在洪水识别上的局限性。该系统巧妙融合全局理解和局部细节能力,在国际标准数据集上创造最佳成绩,参数效率提升93%,为全球洪水预警和防灾减灾提供了更准确可靠的技术方案。