英伟达公司今日宣布计划向荷兰云服务提供商Nebius Group NV投资20亿美元,该公司专注于人工智能工作负载。
这笔资金将帮助该公司扩展数据中心基础设施。Nebius计划部署配备英伟达最新Rubin图形处理器和Vera中央处理器的服务器。公司还将采用BlueField芯片系列,该系列可以将存储硬件管理等辅助任务从服务器CPU中卸载。
Nebius目前向客户提供的最先进英伟达显卡系列是Blackwell。而Nebius即将采用的新GPU Rubin,其推理工作负载的成本效率提升了10倍。
Nebius将与Rubin一起部署的CPU Vera,效率也超越了其前代产品。据报道,配备这两种芯片的设备每瓦性能比英伟达上一代硬件提升了10倍。这些重约两吨的系统包含72个Rubin GPU、32个Vera CPU和超过1000个其他芯片。
该公司在内部运营的数据中心和托管设施中托管其基础设施。公司最大的站点是目前正在新泽西州建设的300兆瓦云计算园区。其数据中心网络还遍布英国、法国、芬兰和冰岛。
Nebius提供托管GPU以及旨在简化AI模型开发的托管服务。它提供MLFlow的托管版本,这是一个开源工具,可以分析AI训练运行的遥测数据来识别低效问题。Nebius的另一项服务提供Jupyter Notebook的云托管实现,这是一个在AI项目中广泛使用的代码编辑器。
结合英伟达的投资,Nebius今日在其云平台上推出了英伟达的Nemotron 3 Super模型。这是一个专家混合算法,优化用于驱动AI智能体。Nemotron 3 Super可以处理多达100万个Token的提示,并激活其1200亿参数中的十分之一来生成答案。
该模型通过Nebius名为Token Factory的服务提供。该服务为开源AI模型扩展了自动扩缩功能和安全防护措施。此外,还支持一种称为投机解码的性能优化方法。该技术通过使AI模型能够将某些计算卸载到更小、更硬件高效的神经网络来加速推理。
Nebius计划在本十年末之前部署超过5千兆瓦的额外计算能力来支持客户工作负载。除了为该计划提供硬件外,英伟达还将提供AI集群设计材料、"技术评审"和其他形式的支持。
这笔投资是在GPU制造商与另一家AI云服务商CoreWeave Inc.签署类似协议几周后进行的。英伟达同意在早先下达63亿美元云基础设施订单后向该初创公司投资20亿美元。CoreWeave计划到2030年部署超过5千兆瓦的计算能力。
Q&A
Q1:英伟达为什么要投资Nebius这家云服务商?
A:英伟达投资20亿美元给Nebius主要是为了扩展AI云计算基础设施。Nebius专注于人工智能工作负载,将部署英伟达最新的Rubin GPU和Vera CPU,帮助英伟达在AI云服务市场建立更强的合作伙伴关系。
Q2:Rubin GPU相比现有的Blackwell有什么优势?
A:Rubin GPU在推理工作负载方面的成本效率比现有产品提升了10倍。配备Rubin GPU和Vera CPU的系统,每瓦性能比英伟达上一代硬件提升了10倍,显著提高了计算效率和降低了运营成本。
Q3:Nebius的Token Factory服务有什么特色功能?
A:Token Factory是Nebius提供的AI模型服务平台,支持英伟达Nemotron 3 Super等模型。该服务为开源AI模型提供自动扩缩功能、安全防护措施,还支持投机解码技术来加速推理性能。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。