Nvidia在2026年消费电子展(CES)上提前发布了全新的Vera Rubin计算平台,此次发布紧随其前代产品Blackwell在人工智能热潮推动下创造历史纪录的一年。
Vera Rubin架构设计特色
在今日主题演讲前的媒体发布会上,Nvidia高性能计算和AI基础设施解决方案高级总监Dion Harris将Vera Rubin描述为"由六个芯片组成的AI超级计算机"。
这六个芯片包括Vera CPU、Rubin GPU、第六代NVLink交换机、Connect-X9网络接口卡、BlueField4数据处理单元以及Spectrum-X 102.4T CPO。该平台将支持第三代机密计算技术,并且据Nvidia称,这将是首个机架级可信计算平台。
性能大幅跃升
Nvidia声称,Rubin GPU在AI训练计算能力方面是Blackwell的五倍。整个Vera Rubin架构可以在与Blackwell相同的时间内训练大型"专家混合"(MOE)AI模型,但只需使用四分之一的GPU数量,Token成本仅为七分之一。
市场前景与发布计划
Rubin平台原计划于2026年年底发布,如今提前推出。这一消息发布几个月前,Nvidia刚刚公布了创纪录的数据中心营收,同比增长66%。这一增长主要由对Blackwell和Blackwell Ultra GPU的需求推动,为Rubin的成功设立了高标准,也成为"AI泡沫"的风向标。基于Rubin平台的产品和服务将从2026年下半年开始通过Nvidia合作伙伴提供。
Q&A
Q1:Vera Rubin平台有什么特别之处?
A:Vera Rubin是由六个芯片组成的AI超级计算机,包括Vera CPU、Rubin GPU、第六代NVLink交换机、Connect-X9网络接口卡、BlueField4数据处理单元和Spectrum-X 102.4T CPO。它是首个机架级可信计算平台,支持第三代机密计算技术。
Q2:Rubin GPU相比Blackwell性能提升有多大?
A:Rubin GPU的AI训练计算能力是Blackwell的五倍。整个Vera Rubin架构可以在相同时间内训练大型"专家混合"AI模型,但只需使用四分之一的GPU数量,Token成本仅为七分之一。
Q3:什么时候可以使用基于Rubin的产品?
A:虽然Vera Rubin平台在2026年CES上提前发布,但基于Rubin平台的产品和服务要等到2026年下半年才能通过Nvidia的合作伙伴获得。原计划是2026年年底发布,现在提前推出了。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。