AI革命中最具代表性的两家公司——英伟达和Palantir Technologies——携手合作,创建了一个AI参考架构操作系统。
新的Palantir AI OS参考架构(AIOS-RA)旨在支持从硬件采购到应用部署的端到端流程。它将作为私有和公共实体设计、部署和扩展高性能AI工厂的蓝图。
该架构在英伟达Blackwell Ultra系统上运行训练和推理任务,该系统集成了八个Blackwell Ultra GPU和Spectrum-X以太网网络。
参考架构建立在强化的Kubernetes基础上,运行各种Foundry服务,如Catalog、Build和Multipass。它还集成了Palantir的完整软件套件,包括AIP、Foundry、Apollo、Rubix和AIP Hub。
管理通过Palantir Rubix进行零信任Kubernetes安全管理,Apollo负责自主部署和生命周期监督。
英伟达的软件堆栈也包含在内,包括英伟达AI Enterprise、CUDA-X库、Nemotron开源模型和Magnum IO加速性能组件。
这项合作让企业完全控制其数据、AI模型和应用程序,同时支持使用开源AI模型和相关数据加速工具。
Palantir AI OS参考架构为企业提供对其数据、AI模型和应用程序的完全控制。对于拥有现有GPU基础设施、延迟敏感工作流程、数据主权要求和高度地理分布的客户来说,这尤为关键。
Palantir首席架构师阿克沙伊·克里希纳斯瓦米在声明中表示:"从我们与美国政府的首次部署开始,以及此后的每次部署中,我们的软件都必须在最复杂和敏感的环境中满足客户必须保持控制的要求。"
他补充说:"与英伟达合作——并基于许多客户现有的投资——我们自豪地交付一个完全集成的AI操作系统,该系统针对英伟达加速计算基础设施进行了优化,使客户能够实现本地、边缘和主权云部署的承诺。"
主权AI是一个新兴市场,代表一个国家努力使用自己的数据开发和维护对自己AI的控制,并将数据保持在其边界内。
Q&A
Q1:Palantir AI OS参考架构是什么?它能解决什么问题?
A:Palantir AI OS参考架构(AIOS-RA)是Palantir与英伟达合作开发的AI操作系统,旨在支持从硬件采购到应用部署的端到端流程,为企业提供设计、部署和扩展高性能AI工厂的完整蓝图。
Q2:这个架构主要适用于哪些企业和场景?
A:该架构特别适用于拥有现有GPU基础设施、有延迟敏感工作流程、数据主权要求和高度地理分布的企业客户,尤其是那些需要完全控制自己数据、AI模型和应用程序的组织。
Q3:主权AI概念在这个合作中有什么意义?
A:主权AI代表一个国家努力使用自己的数据开发和维护对自己AI的控制,并将数据保持在其边界内。这个架构支持本地、边缘和主权云部署,帮助国家和组织实现数据主权要求。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。