想在英伟达硬件上运行具备数字主权的AI系统?SUSE已为此准备好了完整的软件栈。
在本周于捷克共和国布拉格举办的SUSECON 2026大会上,欧洲开源领军企业SUSE正式发布了"SUSE AI Factory with Nvidia"——一个开箱即用、经过预验证的AI平台。该平台旨在帮助企业和政府机构在满足严格监管要求与数字主权标准的前提下,构建、部署并扩展关键任务AI应用。
该平台基于SUSE AI与英伟达AI Enterprise构建,SUSE将其定位为统一软件栈,覆盖从本地沙箱到数据中心,再到云端的全链路AI应用开发与运行场景,标准化整个流程。顾名思义,SUSE将该平台视为AI领域的"数字化生产流水线",为企业提供一套一致的工具,用于大规模组装、管理和治理AI工作负载。
SUSE AI业务副总裁兼总经理Rhys Oxenham在一场圆桌讨论中解释道,公司"意识到技术组合中存在一个关键缺口,那就是需要为企业打造一条流水线,用于AI基础设施的接入、配置、生命周期管理、运维监控和安全防护,并覆盖各类部署场景。"
在技术架构层面,SUSE AI Factory是一个自动化的全软件栈平台,底层依托SUSE Rancher Prime与SUSE Linux Enterprise Server(SLES)构建。Oxenham表示,"该平台将直接构建于SUSE Rancher Prime之上,用户可以非常便捷地进行集成和使用。"
谈及与英伟达的合作,他进一步说道:"SUSE AI Factory with Nvidia在这条流水线的基础上,引入了英伟达AI Enterprise的强大能力。"具体而言,英伟达的贡献包括:用于模型推理服务的Nvidia NIM微服务、开放的Nemotron模型、用于构建和管理AI智能体的Nvidia NeMo、用于GPU调度的Nvidia Run:ai、Nvidia Kubernetes Operators,以及Nvidia OpenShell安全运行时与Nvidia NemoClaw——后者借助SUSE的轻量级K3s Kubernetes发行版,实现安全自主AI智能体的部署。
据SUSE介绍,开发者可在沙箱环境中对AI应用进行原型设计与测试,平台团队则可通过统一的Rancher管理界面或基于GitOps的工作流,将工作负载推送至生产环境,实现集群规模的统一管理。这一标准化流程旨在缩短部署准备时间、降低运维开销,并避免开发团队在各类分散工具与脚本之间疲于应对。
Oxenham总结道:"无论您希望将英伟达AI Enterprise部署在何处,SUSE AI Factory都能提供完整支持。我们对所有组件进行了深度集成,并将安全与可观测性框架延伸至每一个环节。"
SUSE首席技术与产品官Thomas Di Giacomo在圆桌讨论中补充道:"AI开发者、用户和运营团队在AI应用中陷入了一种两难困境——他们希望快速创新,但又必须对工作负载、智能体和流程进行充分的安全管控,确保在正式投入生产前具备完整的可审计性。SUSE AI Factory with Nvidia为他们提供了一站式解决方案,在端到端的稳定性、安全性和主权保障的同时,充分享受当下及未来AI创新带来的红利。"
该平台具备四大核心能力:
规范化一站式蓝图:提供经过预验证的参考架构,整合SUSE与英伟达的核心组件,客户可在此基础上按需扩展,打造定制化工作负载。
零信任安全与可观测性:AI工作负载继承SUSE软件栈的安全加固能力,并在零信任安全框架与治理机制的保障下,确保基础设施的稳定性、可预期性,以及对新兴风险的抵御能力。
部署与生命周期管理简化:提供统一的用户体验,支持从开发者本地设备到离线边缘集群的全场景AI工作负载部署与管理,无论规模大小。
主权保障与统一支持:客户对物理基础设施、数据和模型拥有完全控制权,以满足欧盟AI法案等严格法规要求,实现真正的数字主权。与此同时,SUSE将为包括英伟达AI Enterprise组件在内的整体技术栈提供统一的责任支持体系。
数字主权是此次AI Factory新方案的核心理念之一。富士通旗下企业Fsas Technologies Europe作为首批发布合作伙伴,将以AI Factory with Nvidia为基础,构建其自主的主权AI解决方案体系。
该公司首席技术官Udo Würtz表示:"企业已做好拥抱AI的准备,但他们需要确信自己的数据始终处于可控状态。"他进一步指出,该平台提供了"一个稳定、规范的基础,将英伟达无与伦比的算力与AI平台,同SUSE安全、开源的基础设施有机结合",使Fsas得以专注于向客户交付符合最严格数据治理标准的主权端到端解决方案。
SUSE AI Factory with Nvidia的预览版已在此次展会上正式亮相,SUSE承诺该产品将于2026年晚些时候正式发布。
此次发布进一步强化了SUSE的整体战略定位——成为主权、AI就绪的开源基础设施首选提供商,覆盖Linux、Kubernetes、边缘计算及AI全领域。SUSE能否在这一赛道上取得成功?至少从目前来看,合作伙伴与客户的初步反应相当积极。
Q&A
Q1:SUSE AI Factory with Nvidia是什么?主要解决什么问题?
A:SUSE AI Factory with Nvidia是由SUSE与英伟达联合推出的一站式预验证AI平台,底层基于SUSE Rancher Prime和SUSE Linux Enterprise Server构建。它主要解决企业和政府机构在构建AI基础设施时面临的碎片化工具问题,提供从本地开发到数据中心、云端的标准化全链路AI部署与管理能力,同时满足数字主权和合规监管要求。
Q2:SUSE AI Factory如何保障数据主权和安全合规?
A:平台从多个层面保障数据主权:客户对物理基础设施、数据和模型拥有完全控制权;内置零信任安全框架与治理机制,确保AI工作负载的可审计性;支持满足欧盟AI法案等严格法规要求。此外,SUSE提供跨整体技术栈的统一责任支持体系,降低企业的合规管理负担。
Q3:英伟达在SUSE AI Factory中提供了哪些核心组件?
A:英伟达为该平台贡献了多项关键技术,包括:用于模型推理服务的NIM微服务、开放的Nemotron模型、用于构建和管理AI智能体的NeMo框架、用于GPU资源调度的Run:ai、Kubernetes Operators,以及结合SUSE轻量级K3s发行版实现安全自主智能体部署的NemoClaw等组件。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。