被企业用于数据分析和增强人工智能负载运算的流行开源软件 OpenSearch 正在迎来一次重大更新。
负责该软件开发的中立组织 OpenSearch 软件基金会( Amazon Web Services Inc. )刚刚宣布推出 OpenSearch 3.0,此版本带来了显著的性能提升以及全新的向量搜索功能,旨在加速人工智能的发展。
OpenSearch 项目最初由 Amazon Web Services Inc. 创立,并于 2021 年作为一个社区驱动的 Elasticsearch 替代方案推出。该项目的建立是针对 Elastic N.V. 决定将原本开源的 Elasticsearch 引擎从 Apache 2 许可证切换为更为严格的 Server Side Public License( 被视为反竞争 )而作出的回应。
OpenSearch 是从 Amazon Elasticsearch Service 分支出来的,并以 Elastic 放弃的同一 Apache 2 许可证发布。它是一个功能强大的分布式搜索及分析引擎,旨在高效处理海量数据,并提供快速准确的搜索查询结果。
它常被比作一种数字图书管理员,能组织、编目、检索信息并从庞大数据集中挖掘洞见,但与大多数人类图书管理员不同的是,它能够实时完成这些任务。OpenSearch 被广泛应用于日志分析、搜索引擎构建和数据分析等领域。
据基金会介绍,从今天起推出的 OpenSearch 3.0 版本在 OpenSearch 1.3 的基础上进行了升级,其性能提升高达 9.5 倍。
平台中还新增了数十项功能,旨在便捷 AI 应用,如生成式 AI 聊天机器人、基于检索的生成、混合搜索及推荐引擎。基金会表示,这些应用高度依赖于以数学表示形式存储非结构化信息的向量数据库,这使得算法能够更容易地在海量数据集中识别模式。虽然向量数据库可以显著提升 AI 的性能,但在处理数十亿个向量时,往往面临速度和规模的问题。
借助 GPU 加速实现更高速的向量搜索
OpenSearch 3.0 旨在通过引入 GPU 加速的 OpenSearch 向量引擎来解决这些扩展性问题。作为一项实验性新功能,它借助 Nvidia Corp. 最先进的 GPU 强化大规模向量数据负载下的搜索性能,同时减少索引构建时间,从而降低运营成本。
此外,OpenSearch 现获得 Anthropic PBC. 的 Model Context Protocol 支持,该协议提供了标准化接口,用于将大语言模型与外部数据源及其他开发工具集成。新版本还新增了旨在通过消除冗余向量数据源来降低存储消耗的功能。
除了提升 OpenSearch 的向量处理性能外,基金会还在优化平台数据摄取、传输及管理方式方面做出了巨大努力。例如,新版本新增对 gRPC Remote Procedure Call 框架的支持,作为另一项实验性功能,实现了客户端、服务器和节点之间更高效的数据传输。
其他新增功能包括基于拉取的数据摄取方式,使 OpenSearch 能更好地控制系统中的数据流,以及从 Apache Kafka 等流平台“拉取”数据的能力。读写分离有助于提升索引构建的效率,而整合 Apache Calcite 据称能使查询构建与数据探索更加直观。
最后,新版本还强化了 OpenSearch 的核心基础设施,通过升级至 Lucene 10 提升其搜索与索引功能,并支持 Java 21 最低运行时,使用户能够享受现代编程语言功能及 Java 代码库性能的改进。
基金会理事会主席 Carl Meadows 表示,由于对更先进 AI 应用的强劲需求推动,企业搜索市场预计到 2030 年将增长至超过 89 亿美元。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。