AWS近日发布了其托管搜索与向量引擎的全面重建版本,此次升级旨在更好地满足智能体时代的需求。
新一代Amazon OpenSearch Serverless在空闲时可缩减至零成本运行,与满负荷运行的预置集群相比,运营成本最高可降低60%。
智能体的使用模式通常呈现"突发高峰、长时静默"的特点,这从根本上打破了AWS此前为OpenSearch Serverless所设计的架构假设。
AWS OpenSearch总经理Tia White于今年2月上任,她在接受The New Stack采访时表示:"这次重建规模极大,约97%的内容都是由托管服务团队的工程师从零开始构建的。其中也有一些模块来自开源仓库,但所有真正具有创新性或属于核心知识产权的内容,我们不会通过开源项目对外开放。"
此次架构层面最重大的变化是存储与计算的彻底分离。White介绍说,OpenSearch现在运行在一个全新的专有存储层之上。"集群可以真正缩减至零,也就是说,当资源不活跃时,你无需为任何资源付费。同时,为了应对智能体带来的突发性工作负载,集群可以在数秒内重新启动——我们不希望出现冷启动问题。"
White还指出,新版服务的自动扩缩容速度比上一代提升了20倍,同时在发布之初就支持搜索与向量两种集合类型。整体按OpenSearch计算单元计费,涵盖索引、搜索及GPU加速。此外,本次发布还包括与Vercel及AWS自研IDE Claude的原生集成,以及一套OpenSearch智能体技能包,支持开发者使用Claude Code和Cursor等主流工具进行开发。
60%的成本节省主要来自两个方面:一是新专有存储层内置的压缩功能;二是自动扩缩容机制足够灵敏,能够在流量下降后的数秒内快速降低容量。"由于我们能够预判需求并迅速完成扩缩容,用户自然而然就能节省开支,"White说道。
对于此次重构的背景,White也坦率地给出了解释:"过去的OpenSearch更像一把瑞士军刀,什么都做,却什么都不精。我们去年甚至尝试转型做SIEM(安全信息与事件管理)。"这一转型尝试最终未能落地。新版定位将OpenSearch所擅长的传统搜索与日志分析相结合,并围绕智能体工作负载重新构建产品方向。
这一"双支柱"战略转型背后,也伴随着White在采访中透露的产品路线图。
智能体长期记忆功能预计于2026年下半年推出,并从上线首日起内置评估与治理机制。White对这一设计难题如此描述:"评估——也可以说是治理的一部分——既是一门艺术,也是一门科学。什么内容值得保留、什么内容应该清除,这种持续的反馈循环本身就极具挑战性。"
她强调,这些安全护栏无法在事后补充进去。"打造以智能体为核心的平台,这些能力必须从第一天起就具备,不能作为事后补丁或附加功能。"此外,该公司还在持续完善OpenSearch Serverless围绕知识图谱与语义层的功能建设,并同步推进White所描述的"面向搜索特定工作负载的高级推理模型"。
White透露,一项重大的日志分析功能将于6月正式发布,届时AWS将重返目前由Datadog、Splunk和Grafana主导的市场。随后,TIMESERIES集合类型将在AWS纽约峰会上亮相,进一步将OpenSearch Serverless延伸至更多可观测性场景。
"当精准度足够高、Token使用得到充分优化之后,你不得不思考:大语言模型能否取代OpenSearch这类工具?"White如此发问。但AWS的答案是:OpenSearch Serverless乃至整个OpenSearch体系,将成为大语言模型调用的关键语义层,而非被大语言模型所取代。
Q&A
Q1:Amazon OpenSearch Serverless新版本的成本为何能降低60%?
A:新版本的成本节省主要来自两个方面:一是采用了内置压缩功能的新专有存储层,显著降低存储开销;二是自动扩缩容机制响应速度极快,能在流量下降后数秒内迅速降低容量。此外,集群在空闲时可真正缩减至零,用户无需为不活跃的资源付费,相较于始终满负荷运行的预置集群,综合成本最高可降低60%。
Q2:Amazon OpenSearch Serverless新架构与旧架构相比,最核心的变化是什么?
A:最核心的变化是存储与计算的彻底分离。新版本引入了全新的专有存储层,使集群能够真正缩减至零并在数秒内快速启动,避免冷启动问题。自动扩缩容速度比上一代提升了20倍,专为智能体"突发高峰、长时静默"的使用模式而优化。此外,约97%的代码由工程师从零重建,属于全面的架构级升级,而非局部改良。
Q3:Amazon OpenSearch Serverless未来有哪些新功能规划?
A:根据路线图,智能体长期记忆功能预计于2026年下半年推出,并从上线首日起内置评估与治理机制。重大日志分析功能将于近期发布,帮助AWS重返Datadog、Splunk和Grafana主导的市场。TIMESERIES集合类型将在AWS纽约峰会上亮相,覆盖更多可观测性场景。此外,知识图谱、语义层及面向搜索的高级推理模型也在持续建设中。
好文章,需要你的鼓励
Velotric Tempo是一款以骑行体验为核心的轻量级通勤电动自行车,整车重量仅17.7kg。配备350W后轮毂电机和360Wh电池,续航可达50-65公里。支持踏频与扭矩传感器双模式切换,骑行感受自然流畅。内置Apple Find My及安卓追踪功能,具备UL认证和IPX6/IPX7防水等级。主要不足在于Class 3模式下油门被完全禁用,油门手感欠佳,且售价1499美元略偏高,挡泥板和后货架需另购。
PaW是一种为AI智能体设计的协同训练框架,无需额外模型或数据,仅利用强化学习训练中已有的轨迹数据,让智能体同时学会决策与预测环境变化,在多个任务上取得稳定提升。
一家加拿大家具制造商借助发那科M-710iC工业机器人,成功将传统劳动密集型软垫工序自动化。该系统由发那科授权系统集成商Dvolu开发,集机器视觉、机器人操作与激光裁剪于一体,可完成面料拉伸、钉合、裁剪及码垛等工序,无需人工干预即可适应零件差异。项目旨在解决家具行业劳动力短缺问题,为难以招募和留用工人的岗位提供有效替代方案。
萨尔大学团队提出语义运动锚点方法,通过自动生成同时描述手势外观与交流意图的自然语言说明书,让AI更准确地检索与语言语义匹配的手势,在BEAT2数据集上检索准确率提升8.2%。