数据基础设施巨头Vast Data公司今日宣布扩大与云数据中心运营商CoreWeave的合作,签署价值11.7亿美元的商业协议,将VAST AI OS打造为云端人工智能工作负载的主要数据基础。
CoreWeave自今年上市以来已成为华尔街宠儿,凭借AI行业蓬勃发展实现业务指数级增长。该公司运营庞大的云端数据中心网络,配备英伟达最先进的图形处理器和其他高端AI加速器。公司将这些计算能力租赁给需要为AI系统提供更强算力的企业客户,直接与亚马逊AWS和谷歌云等公有云巨头竞争。
Vast Data专注数据存储领域,致力于将自身定位为AI数据的主要平台,而AI数据正是大语言模型和生成式AI系统的重要燃料。通过VAST AI OS,公司利用其"解耦与全共享"架构,将存储介质从计算资源中分离,创建AI数据操作系统。该系统允许客户存储几乎无限量的数据,这些数据可以独立于客户计算资源进行访问,以更低延迟为AI系统提供数据支持。
VAST AI OS支持各种存储类型,包括文件、对象、块、表格和流数据,并提供无服务器功能和向量搜索等AI专用功能。该平台已成为CoreWeave数据中心基础设施的关键组件,为云公司客户提供海量数据集的实时访问,实现更经济、更低延迟的AI训练和推理。
CoreWeave联合创始人兼首席战略官Brian Venturo表示,VAST AI OS支撑着公司设计和交付云基础设施的多个方面。"这项合作使我们能够提供市场上性能最强、可扩展性最好、成本效益最高的AI基础设施。"
凭借VAST AI OS的可扩展系统架构,CoreWeave表示可以在其任何数据中心为客户快速部署该平台,为最苛刻的AI工作负载提供即时、可靠、高性能的数据基础。扩大的合作将使CoreWeave与Vast Data共同为联合客户提供更先进的数据服务,包括帮助优化数据管道的新功能。通过这些新服务,两家公司表示客户将能够比以往更快地行动和更高效地扩展。
NAND Research分析师Steve McDowell表示,在CoreWeave等云服务商规模部署的AI工作负载需要完全不同的存储方法。他告诉SiliconANGLE,在如此规模下,确保GPU不会因等待所需数据而频繁启停至关重要,传统存储系统根本无法胜任。
"这正是Vast Data等专业供应商的优势所在,"McDowell说道。"它将高性能可扩展并行文件系统的最佳功能与AI优化特性相结合,旨在防止AI工作流程因等待数据而延迟。"
McDowell指出,值得注意的是CoreWeave并未完全依赖Vast Data的数据基础设施。它还与Vast Data的主要竞争对手WekaIO合作,为客户提供两个平台的选择。"CoreWeave的多供应商策略表明,在大规模AI数据挑战面前,仍然没有单一解决方案。"
Vast Data创始人兼首席执行官Renen Hallak持不同观点,他表示扩大的合作意味着VAST AI OS将成为全球最雄心勃勃AI项目的基础。"我们与CoreWeave的深度整合源于在业务和技术层面并肩合作的长期承诺。通过协调我们的发展路线图,我们正在提供组织在市场其他地方找不到的AI平台。"
Q&A
Q1:VAST AI OS是什么系统?有什么特点?
A:VAST AI OS是Vast Data开发的AI数据操作系统,采用"解耦与全共享"架构,将存储介质从计算资源中分离。它允许客户存储几乎无限量的数据,支持文件、对象、块、表格和流数据等各种存储类型,并提供无服务器功能和向量搜索等AI专用功能。
Q2:CoreWeave为什么选择与Vast Data合作?
A:CoreWeave需要为客户提供高性能的AI基础设施,而VAST AI OS能够为海量数据集提供实时访问,实现更经济、更低延迟的AI训练和推理。该平台支撑着CoreWeave设计和交付云基础设施的多个方面,帮助提供市场上性能最强、可扩展性最好的AI基础设施。
Q3:AI工作负载对存储有什么特殊要求?
A:大规模AI工作负载需要确保GPU不会因等待数据而频繁启停,传统存储系统无法满足这种需求。需要专业的高性能可扩展并行文件系统,结合AI优化特性,防止AI工作流程因等待数据而产生延迟,这正是VAST AI OS等专业解决方案的优势所在。
好文章,需要你的鼓励
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
这项由圣母大学和IBM研究院联合开展的研究,开发出了名为DeepEvolve的AI科学助手系统,能够像人类科学家一样进行深度文献研究并将创新想法转化为可执行的算法程序。该系统突破了传统AI要么只能改进算法但缺乏创新、要么只能提出想法但无法实现的局限,在化学、生物学、数学等九个科学领域的测试中都实现了显著的算法性能提升,为AI辅助科学发现开辟了新的道路。
人工智能初创公司aiOla推出基于流匹配训练技术的语音AI模型Drax,挑战OpenAI和阿里巴巴等巨头。该模型重新定义语音算法训练方式,能在嘈杂环境中准确识别语音,兼顾速度与准确性。相比OpenAI的Whisper和阿里巴巴Qwen2,Drax采用并行流处理技术,速度提升32倍,词错误率仅7.4%。该模型已在GitHub开源,提供三种规模版本。
卡内基梅隆大学研究团队通过3331次大规模实验,系统揭示了代码训练如何提升AI推理能力。研究发现,代码的结构特性比语义内容更重要,适当的抽象形式(如伪代码)可以达到与原始代码相同的效果。不同编程语言产生差异化影响:低抽象语言有利于数学推理,Python更适合自然语言任务。这些发现为AI训练数据的科学化设计提供了重要指导。