AWS为何彻底重构OpenSearch架构以应对智能体工作负载

AWS近日发布了对Amazon OpenSearch Serverless的近乎全面重构版本,97%的代码由工程师从头构建。新架构实现了存储与计算的彻底分离,支持空闲时缩减至零,与峰值容量相比可节省最高60%的成本。系统自动扩缩速度提升20倍,能在数秒内响应AI智能体的突发流量需求。此外,AWS还预告了2026年下半年推出的智能体长期记忆功能,以及即将发布的日志分析和时序数据集合类型。

AWS近日发布了其托管搜索与向量引擎的全面重建版本,此次升级旨在更好地满足智能体时代的需求。

新一代Amazon OpenSearch Serverless在空闲时可缩减至零成本运行,与满负荷运行的预置集群相比,运营成本最高可降低60%。

智能体的使用模式通常呈现"突发高峰、长时静默"的特点,这从根本上打破了AWS此前为OpenSearch Serverless所设计的架构假设。

AWS OpenSearch总经理Tia White于今年2月上任,她在接受The New Stack采访时表示:"这次重建规模极大,约97%的内容都是由托管服务团队的工程师从零开始构建的。其中也有一些模块来自开源仓库,但所有真正具有创新性或属于核心知识产权的内容,我们不会通过开源项目对外开放。"

此次架构层面最重大的变化是存储与计算的彻底分离。White介绍说,OpenSearch现在运行在一个全新的专有存储层之上。"集群可以真正缩减至零,也就是说,当资源不活跃时,你无需为任何资源付费。同时,为了应对智能体带来的突发性工作负载,集群可以在数秒内重新启动——我们不希望出现冷启动问题。"

White还指出,新版服务的自动扩缩容速度比上一代提升了20倍,同时在发布之初就支持搜索与向量两种集合类型。整体按OpenSearch计算单元计费,涵盖索引、搜索及GPU加速。此外,本次发布还包括与Vercel及AWS自研IDE Claude的原生集成,以及一套OpenSearch智能体技能包,支持开发者使用Claude Code和Cursor等主流工具进行开发。

60%的成本节省主要来自两个方面:一是新专有存储层内置的压缩功能;二是自动扩缩容机制足够灵敏,能够在流量下降后的数秒内快速降低容量。"由于我们能够预判需求并迅速完成扩缩容,用户自然而然就能节省开支,"White说道。

对于此次重构的背景,White也坦率地给出了解释:"过去的OpenSearch更像一把瑞士军刀,什么都做,却什么都不精。我们去年甚至尝试转型做SIEM(安全信息与事件管理)。"这一转型尝试最终未能落地。新版定位将OpenSearch所擅长的传统搜索与日志分析相结合,并围绕智能体工作负载重新构建产品方向。

这一"双支柱"战略转型背后,也伴随着White在采访中透露的产品路线图。

智能体长期记忆功能预计于2026年下半年推出,并从上线首日起内置评估与治理机制。White对这一设计难题如此描述:"评估——也可以说是治理的一部分——既是一门艺术,也是一门科学。什么内容值得保留、什么内容应该清除,这种持续的反馈循环本身就极具挑战性。"

她强调,这些安全护栏无法在事后补充进去。"打造以智能体为核心的平台,这些能力必须从第一天起就具备,不能作为事后补丁或附加功能。"此外,该公司还在持续完善OpenSearch Serverless围绕知识图谱与语义层的功能建设,并同步推进White所描述的"面向搜索特定工作负载的高级推理模型"。

White透露,一项重大的日志分析功能将于6月正式发布,届时AWS将重返目前由Datadog、Splunk和Grafana主导的市场。随后,TIMESERIES集合类型将在AWS纽约峰会上亮相,进一步将OpenSearch Serverless延伸至更多可观测性场景。

"当精准度足够高、Token使用得到充分优化之后,你不得不思考:大语言模型能否取代OpenSearch这类工具?"White如此发问。但AWS的答案是:OpenSearch Serverless乃至整个OpenSearch体系,将成为大语言模型调用的关键语义层,而非被大语言模型所取代。

Q&A

Q1:Amazon OpenSearch Serverless新版本的成本为何能降低60%?

A:新版本的成本节省主要来自两个方面:一是采用了内置压缩功能的新专有存储层,显著降低存储开销;二是自动扩缩容机制响应速度极快,能在流量下降后数秒内迅速降低容量。此外,集群在空闲时可真正缩减至零,用户无需为不活跃的资源付费,相较于始终满负荷运行的预置集群,综合成本最高可降低60%。

Q2:Amazon OpenSearch Serverless新架构与旧架构相比,最核心的变化是什么?

A:最核心的变化是存储与计算的彻底分离。新版本引入了全新的专有存储层,使集群能够真正缩减至零并在数秒内快速启动,避免冷启动问题。自动扩缩容速度比上一代提升了20倍,专为智能体"突发高峰、长时静默"的使用模式而优化。此外,约97%的代码由工程师从零重建,属于全面的架构级升级,而非局部改良。

Q3:Amazon OpenSearch Serverless未来有哪些新功能规划?

A:根据路线图,智能体长期记忆功能预计于2026年下半年推出,并从上线首日起内置评估与治理机制。重大日志分析功能将于近期发布,帮助AWS重返Datadog、Splunk和Grafana主导的市场。TIMESERIES集合类型将在AWS纽约峰会上亮相,覆盖更多可观测性场景。此外,知识图谱、语义层及面向搜索的高级推理模型也在持续建设中。

来源:The New Stack

0赞

好文章,需要你的鼓励

2026

06/08

14:24

分享

点赞

邮件订阅