分解式共享一切 ( DASE ) 平行存储与 AI 软件栈供应商 VAST Data 宣布推出一款 AI 操作系统。
VAST 设想了一种全新的计算范式,其中“数万亿个智能代理将在边缘部署、AI 工厂和云数据中心交织而成的全球网格中进行推理、通信和行动,每个网格由数百万块 GPU 构成。” 它将提供统一的计算与数据云,并从单一快速且经济高效的存储层中为新型 AI 工作负载提供近乎无限量的数据。
VAST 联合创始人兼 CEO Renen Hallak 表示: “这不仅仅是一个产品发布——这是计算演进史上的一个里程碑。我们在过去十年中重新构想了数据与智能如何融合。今天,我们自豪地推出面向一个不再以应用为中心,而以智能代理为核心的世界的 AI 操作系统。”
该 AI 操作系统基于 VAST 现有的 AI 数据平台构建,提供用于分布式智能代理计算和 AI 代理的服务。其组成部分包括: o 内核,用于在私有云和公有云上运行平台服务 o 运行时,用于部署 AI 代理 —— AgentEngine o 事件处理基础设施,用于实时事件处理 —— Data Engine o 消息传递基础设施 o 分布式文件与数据库存储系统,可用于实时数据捕捉和分析 —— DataStore、DataBase 和 Data Space
VAST 正在推出一项全新的 AgentEngine 功能。其 InsightEngine 利用 AI 预处理数据以供 AI 使用。AgentEngine 是一款具备自动扩展能力的 AI 代理部署运行时,为用户提供一个低代码环境来构建智能工作流、选择推理模型、定义代理工具并实现推理的运营化。
该平台配备了 AI 代理工具服务器,支持代理调用数据、元数据、功能、网络搜索或其他代理,并将它们作为 MCP 兼容工具使用。代理可以扮演具有不同用途和安全凭证的多个角色。代理工具服务器提供对各类工具的安全、实时访问,其调度器和容错队列机制确保代理在机器或服务故障时仍具备韧性。
AgentEngine 具备智能代理工作流的可观察性,采用并行、分布式追踪,使开发者能够统一且简洁地查看规模庞大且复杂的智能代理流水线。
VAST 表示,它将以每月一个的速度发布一系列开源代理。其中,一些个人助理代理将针对特定行业应用进行定制,而其他代理则设计为通用用途。示例包括: o 一个推理聊天机器人,基于整个组织的 VAST 数据驱动 o 一个数据工程代理,用于自动管理数据 o 一个提示工程师代理,帮助优化 AI 工作流输入 o 一个元代理,用于自动部署、评估和改进代理 o 一个合规性代理,用于执行数据和活动级合规性要求 o 一个编辑代理,用于创建丰富的媒体内容 o 一个生命科学研究代理,协助生物信息学发现
VAST Data 将在全年开展一系列 “VAST Forward” 全球研讨会,包括线下和线上形式。这些活动将涵盖 AI 操作系统组件的培训以及如何在该平台上进行开发的讲座。
评论 VAST 的 AI 操作系统并非像 Windows 或 Linux 那样的独立操作系统,它们是关注于硬件和基本服务的低级、处理器绑定系统。而该 AI 操作系统代表了 VAST 对 “思维机器” 愿景的最终呈现,是一个完整的 AI 栈实体。
Nvidia 拥有其 AI Enterprise 软件套件,支持生产级 AI 应用程序的开发与部署,其中包括生成式 AI 和智能代理 AI 系统。该套件包括类似 NIM 的微服务,并支持构建和部署 AI 代理以及管理 AI 工作流的工具,但它并不是一个完整的操作系统。
Dell 和 HPE 都拥有类似 AI 工厂的方案,这些方案可视为有潜力发展成为 AI 操作系统的方式。
附注 VAST 声称,它创下了所有数据公司历史上累计预订达到 20 亿美元最快的记录。在 2025 年第一季度,其同比增长近 5 倍,其 DASE 集群全球支持超过 100 万个 GPU。VAST 表示,其商业模式实现了正向现金流。
好文章,需要你的鼓励
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
本文提出一种评估人工智能风险的新方法,借鉴生态学与演化论视角,从理论生态模型中推导出三项风险指标,涵盖种群模型与生态系统模型。研究旨在为AI治理策略提供量化工具,并对分析局限性及政策改进方向进行了深入探讨,为构建更科学的AI风险评估体系提供参考框架。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。