被企业用于数据分析和增强人工智能负载运算的流行开源软件 OpenSearch 正在迎来一次重大更新。
负责该软件开发的中立组织 OpenSearch 软件基金会( Amazon Web Services Inc. )刚刚宣布推出 OpenSearch 3.0,此版本带来了显著的性能提升以及全新的向量搜索功能,旨在加速人工智能的发展。
OpenSearch 项目最初由 Amazon Web Services Inc. 创立,并于 2021 年作为一个社区驱动的 Elasticsearch 替代方案推出。该项目的建立是针对 Elastic N.V. 决定将原本开源的 Elasticsearch 引擎从 Apache 2 许可证切换为更为严格的 Server Side Public License( 被视为反竞争 )而作出的回应。
OpenSearch 是从 Amazon Elasticsearch Service 分支出来的,并以 Elastic 放弃的同一 Apache 2 许可证发布。它是一个功能强大的分布式搜索及分析引擎,旨在高效处理海量数据,并提供快速准确的搜索查询结果。
它常被比作一种数字图书管理员,能组织、编目、检索信息并从庞大数据集中挖掘洞见,但与大多数人类图书管理员不同的是,它能够实时完成这些任务。OpenSearch 被广泛应用于日志分析、搜索引擎构建和数据分析等领域。
据基金会介绍,从今天起推出的 OpenSearch 3.0 版本在 OpenSearch 1.3 的基础上进行了升级,其性能提升高达 9.5 倍。
平台中还新增了数十项功能,旨在便捷 AI 应用,如生成式 AI 聊天机器人、基于检索的生成、混合搜索及推荐引擎。基金会表示,这些应用高度依赖于以数学表示形式存储非结构化信息的向量数据库,这使得算法能够更容易地在海量数据集中识别模式。虽然向量数据库可以显著提升 AI 的性能,但在处理数十亿个向量时,往往面临速度和规模的问题。
借助 GPU 加速实现更高速的向量搜索
OpenSearch 3.0 旨在通过引入 GPU 加速的 OpenSearch 向量引擎来解决这些扩展性问题。作为一项实验性新功能,它借助 Nvidia Corp. 最先进的 GPU 强化大规模向量数据负载下的搜索性能,同时减少索引构建时间,从而降低运营成本。
此外,OpenSearch 现获得 Anthropic PBC. 的 Model Context Protocol 支持,该协议提供了标准化接口,用于将大语言模型与外部数据源及其他开发工具集成。新版本还新增了旨在通过消除冗余向量数据源来降低存储消耗的功能。
除了提升 OpenSearch 的向量处理性能外,基金会还在优化平台数据摄取、传输及管理方式方面做出了巨大努力。例如,新版本新增对 gRPC Remote Procedure Call 框架的支持,作为另一项实验性功能,实现了客户端、服务器和节点之间更高效的数据传输。
其他新增功能包括基于拉取的数据摄取方式,使 OpenSearch 能更好地控制系统中的数据流,以及从 Apache Kafka 等流平台“拉取”数据的能力。读写分离有助于提升索引构建的效率,而整合 Apache Calcite 据称能使查询构建与数据探索更加直观。
最后,新版本还强化了 OpenSearch 的核心基础设施,通过升级至 Lucene 10 提升其搜索与索引功能,并支持 Java 21 最低运行时,使用户能够享受现代编程语言功能及 Java 代码库性能的改进。
基金会理事会主席 Carl Meadows 表示,由于对更先进 AI 应用的强劲需求推动,企业搜索市场预计到 2030 年将增长至超过 89 亿美元。
好文章,需要你的鼓励
微软公布2025财年第四季度业绩,营收764亿美元,同比增长18%。CEO纳德拉首次透露Azure云平台年营收超750亿美元,同比增长34%。公司计划在2025财年投入800亿美元资本支出建设AI数据中心。尽管分析师质疑AI变现能力,但投资者反应积极,推动微软股价上涨8%,市值突破4万亿美元大关。
这项研究由哈佛大学团队开发的创新框架,解决了多机构数据共享的核心难题。他们巧妙结合联邦学习、局部差分隐私和公平性约束,使不同机构能在保护数据隐私的同时协作开发更准确、更公平的决策模型。实验证明,该方法在多个真实数据集上既保障了隐私,又显著提升了模型公平性,为医疗、金融和政府等领域的数据协作提供了实用解决方案。
微软CEO纳德拉在财报电话会议中宣布,GitHub Copilot AI编程工具的累计用户数已超过2000万。过去三个月新增500万用户,企业客户增长率达75%。财富100强中90%的公司都在使用该工具。AI编程工具市场竞争激烈,Cursor等竞争对手也在快速增长,年度经常性收入已超过5亿美元。
Meta AI研究团队开发的ALOHA系统是一种低成本开源的双臂机器人远程操作平台,旨在使机器人学习更加民主化和普及化。该系统结合了价格亲民的硬件设计和先进的行为克隆学习算法,使机器人能够从人类示范中学习复杂技能。研究表明,ALOHA系统展示了强大的泛化能力,能够在新环境中应用所学技能,如打开不同类型的瓶子。系统的开源性质鼓励全球研究者参与并推动机器人学习领域的发展,尽管仍面临成本和精确力控制等挑战。