随着企业将AI工作负载推向生产环境,它们遇到了一个熟悉的难题:平台碎片化。云原生计算基金会(CNCF)在2025年北美KubeCon + CloudNativeCon大会上新发布的Kubernetes AI一致性认证计划,正是为了解决AI领域众多分散平台、工具和标准的问题。
长期CNCF支持者和Kubernetes贡献者VMware by Broadcom也宣布,其vSphere Kubernetes Service(VKS)已获得认证,成为首批符合新AI标准的平台之一。
在亚特兰大KubeCon大会现场录制的The New Stack Makers节目中,TNS创始人兼发行人Alex Williams与Broadcom工程高级总监Dilpreet Bindra以及产品营销总监Himanshu Singh讨论了这些在Kubernetes上运行AI工作负载的开放社区定义标准。
新一致性计划的意义
Bindra认为新的一致性计划体现了CNCF从Kubernetes早期发展中汲取的经验教训。
"AI工具领域存在很多混乱,"他指出。"通过AI一致性计划,CNCF正在重复他们在Kubernetes初期所做的工作,确保基于这些工具开发的应用程序能够在多个不同平台上使用。"
Singh补充说,一致性"核心理念是可移植性。"平台供应商、基础设施团队、企业AI从业者和Kubernetes开源贡献者都需要一个通用且可互操作的基础。"如果我在公有云上运行并想将应用程序迁移到私有云,或者反之,一致性意味着我应该能够以最小的阻力将应用程序迁移到最适合的地方。"
vSphere Kubernetes Service的独特优势
VMware vSphere Kubernetes Service是CNCF认证的Kubernetes运行时,作为VMware Cloud Foundation的一部分提供。Bindra表示,VKS的独特之处在于它与底层vSphere平台的深度集成,而不是添加另一个抽象层。VMware将VKS架构设计为直接使用Kubernetes API对抗基础设施。
"一切都是YAML文档,所有的对象,"Bindra说。"这意味着虚拟机、Pod、持久卷和Kubernetes集群本身都可以通过Kubernetes API和Argo CD等工具以声明式方式管理。"
为了支持这一点,最新的VKS版本包含一个新的附加组件管理系统,让用户能够管理所有VKS集群的扩展,无论是预打包组件还是第三方工具。
Kubernetes成为AI工作负载的坚实基础
Singh和Bindra一致认为,这一切之所以成为可能,是因为Kubernetes本身已经成为不可动摇的基础。这种稳定性使企业能够信任Kubernetes处理生产AI工作负载。这也是Broadcom一直加倍支持Cluster API和etcd等基础项目的原因,这些组件使可靠、可扩展的Kubernetes成为可能。
"现在有更多用户、应用程序和企业完全信任这项技术,"Bindra说。"我们的观点是,未来大部分应用程序开发都将使用Kubernetes完成。"
Singh补充道:"你希望技术成熟,希望平台成熟,然后社区可以继续构建,持续扩展并将事物提升到新水平。"
"而在这个时间点,"他总结道,"AI就是那个新水平。"
Q&A
Q1:CNCF推出的Kubernetes AI一致性认证计划主要解决什么问题?
A:该计划主要解决AI领域平台碎片化问题。随着企业将AI工作负载推向生产环境,面临众多分散的平台、工具和标准。一致性认证确保基于这些工具开发的应用程序能够在多个不同平台上使用,核心理念是实现可移植性,让企业能够以最小阻力在公有云和私有云之间迁移AI应用。
Q2:VMware vSphere Kubernetes Service有什么独特优势?
A:VKS的独特之处在于与底层vSphere平台的深度集成,而不是添加抽象层。它直接使用Kubernetes API对抗基础设施,将一切都设计为YAML文档形式。这意味着虚拟机、Pod、持久卷和Kubernetes集群都可以通过Kubernetes API和工具以声明式方式统一管理。
Q3:为什么说Kubernetes已成为AI工作负载的可靠基础?
A:Kubernetes本身已经成为不可动摇的稳定基础,这种稳定性使企业能够信任它处理生产AI工作负载。现在有更多用户、应用程序和企业完全信任这项技术。随着技术和平台的成熟,社区可以继续构建和扩展,而AI正是当前发展的新水平。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
伊尔德兹技术大学团队通过词典手术和离线蒸馏,以不足20美元成本打造出专为土耳其语优化的200M参数句子嵌入模型,在语义相似度任务上超越了参数量更大的原版教师模型。