被企业用于数据分析和增强人工智能负载运算的流行开源软件 OpenSearch 正在迎来一次重大更新。
负责该软件开发的中立组织 OpenSearch 软件基金会( Amazon Web Services Inc. )刚刚宣布推出 OpenSearch 3.0,此版本带来了显著的性能提升以及全新的向量搜索功能,旨在加速人工智能的发展。
OpenSearch 项目最初由 Amazon Web Services Inc. 创立,并于 2021 年作为一个社区驱动的 Elasticsearch 替代方案推出。该项目的建立是针对 Elastic N.V. 决定将原本开源的 Elasticsearch 引擎从 Apache 2 许可证切换为更为严格的 Server Side Public License( 被视为反竞争 )而作出的回应。
OpenSearch 是从 Amazon Elasticsearch Service 分支出来的,并以 Elastic 放弃的同一 Apache 2 许可证发布。它是一个功能强大的分布式搜索及分析引擎,旨在高效处理海量数据,并提供快速准确的搜索查询结果。
它常被比作一种数字图书管理员,能组织、编目、检索信息并从庞大数据集中挖掘洞见,但与大多数人类图书管理员不同的是,它能够实时完成这些任务。OpenSearch 被广泛应用于日志分析、搜索引擎构建和数据分析等领域。
据基金会介绍,从今天起推出的 OpenSearch 3.0 版本在 OpenSearch 1.3 的基础上进行了升级,其性能提升高达 9.5 倍。
平台中还新增了数十项功能,旨在便捷 AI 应用,如生成式 AI 聊天机器人、基于检索的生成、混合搜索及推荐引擎。基金会表示,这些应用高度依赖于以数学表示形式存储非结构化信息的向量数据库,这使得算法能够更容易地在海量数据集中识别模式。虽然向量数据库可以显著提升 AI 的性能,但在处理数十亿个向量时,往往面临速度和规模的问题。
借助 GPU 加速实现更高速的向量搜索
OpenSearch 3.0 旨在通过引入 GPU 加速的 OpenSearch 向量引擎来解决这些扩展性问题。作为一项实验性新功能,它借助 Nvidia Corp. 最先进的 GPU 强化大规模向量数据负载下的搜索性能,同时减少索引构建时间,从而降低运营成本。
此外,OpenSearch 现获得 Anthropic PBC. 的 Model Context Protocol 支持,该协议提供了标准化接口,用于将大语言模型与外部数据源及其他开发工具集成。新版本还新增了旨在通过消除冗余向量数据源来降低存储消耗的功能。
除了提升 OpenSearch 的向量处理性能外,基金会还在优化平台数据摄取、传输及管理方式方面做出了巨大努力。例如,新版本新增对 gRPC Remote Procedure Call 框架的支持,作为另一项实验性功能,实现了客户端、服务器和节点之间更高效的数据传输。
其他新增功能包括基于拉取的数据摄取方式,使 OpenSearch 能更好地控制系统中的数据流,以及从 Apache Kafka 等流平台“拉取”数据的能力。读写分离有助于提升索引构建的效率,而整合 Apache Calcite 据称能使查询构建与数据探索更加直观。
最后,新版本还强化了 OpenSearch 的核心基础设施,通过升级至 Lucene 10 提升其搜索与索引功能,并支持 Java 21 最低运行时,使用户能够享受现代编程语言功能及 Java 代码库性能的改进。
基金会理事会主席 Carl Meadows 表示,由于对更先进 AI 应用的强劲需求推动,企业搜索市场预计到 2030 年将增长至超过 89 亿美元。
好文章,需要你的鼓励
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。