图数据库厂商Neo4j公司今日发布了Infinigraph,称其为分布式图技术的重大进步。
该公司表示,这一架构允许用户在单一图数据库平台上同时运行操作和分析工作负载,处理规模超过100TB,且无需分割图结构、复制基础设施或影响性能。
经过两年多的开发,Infinigraph解决了事务系统与分析工作负载协调的问题。Neo4j的早期版本需要在单台物理计算机上运行,这意味着组织必须使用提取/传输/加载管道、同步或多个数据库来处理大量数据。
Infinigraph通过使用分片技术解决了这一限制。分片是一种将大型数据集拆分为更小、更易管理片段的数据库技术,可支持数十亿关系和数千个并发查询跨多个处理器执行,同时保持事务场景所需的原子性、一致性、隔离性和持久性(ACID)特性。
该公司可以在多台机器间对图数据进行分片,同时保持其逻辑一致性,实现数据的自动分发和扩展,无需应用程序重写或人工干预。
Neo4j表示,新架构允许客户将数千万文档作为向量直接嵌入图中。这使得欺诈检测、产品知识图谱、长期合规监控和语义搜索等用例能够在更大、更丰富的数据量上进行。
Neo4j技术总裁Sudhir Hasbe表示:"我们现在能够在Neo4j数据库中支持数十亿个向量。这在生命科学领域特别有用,公司需要处理数千万份科学文档进行药物发现。过去,这些文档是孤立的。现在,它们可以直接嵌入到图中。"
四年前,Neo4j通过引入Fabric为新架构奠定了基础,实现了跨机器的联邦图查询,但客户必须自己管理分片。Infinigraph自动化了这一过程,同时保持完整的ACID合规性。
"由于遍历查询的存在,图分片是一个困难的问题,"Hasbe说,"我们通过在一个环境中维护全局索引实现快速路径查询,同时将实际数据分布在多台机器上实现水平扩展来解决这个问题。即使是分布式事务也保持一致和可靠。"
Neo4j还强调了图作为生成式AI中使用的向量数据库的价值。AI训练需要结构化和非结构化数据。该公司在2023年首次添加了向量支持,允许文档以向量嵌入的形式存储。Infinigraph实现了更大规模的存储。
"生成式AI使非结构化数据比以往更有价值,"Hasbe说,"我们看到客户从使用Elastic Store处理向量转向在Neo4j内管理一切。这大大简化了他们的技术栈。"
Infinigraph目前在Neo4j自管理企业版中提供早期访问,更广泛的可用性计划在10月推出。该公司表示,该功能很快将在其AuraDB云原生图平台中提供。
Infinigraph的定价将采用解耦模式,分离计算和存储以提供更大的灵活性。"我们正在将定价模式与现代分布式系统的运行方式保持一致,"Hasbe说,"这允许客户扩展工作负载而不会产生意外成本。"他表示,工作负载较小的客户可能会看到成本较当前支付的费用有所下降。
Q&A
Q1:Infinigraph是什么?它解决了什么问题?
A:Infinigraph是Neo4j公司发布的分布式图技术架构,它解决了事务系统与分析工作负载协调的问题。该架构允许用户在单一图数据库平台上同时运行操作和分析工作负载,处理规模超过100TB,无需分割图结构、复制基础设施或影响性能。
Q2:Infinigraph与之前的Neo4j版本有什么区别?
A:之前的Neo4j版本需要在单台物理计算机上运行,组织必须使用多个数据库来处理大量数据。Infinigraph通过分片技术可以在多台机器间对图数据进行分片,同时保持逻辑一致性,实现数据的自动分发和扩展,无需应用程序重写或人工干预。
Q3:Infinigraph在生成式AI方面有什么优势?
A:Infinigraph能够支持数十亿个向量,可以将数千万文档作为向量直接嵌入图中。这在生命科学等领域特别有用,比如处理数千万份科学文档进行药物发现。生成式AI使非结构化数据更有价值,客户可以在Neo4j内管理一切,大大简化技术栈。
好文章,需要你的鼓励
谷歌发布数据共享模型上下文协议服务器,使开发者和AI智能体能够通过自然语言访问真实世界统计数据。该服务整合了政府调查、行政数据和联合国等全球机构的公共数据集。新服务旨在解决AI系统训练中常见的数据噪声和幻觉问题,为AI提供可验证的结构化信息。谷歌还与ONE Campaign合作推出数据智能体工具,该开源服务器兼容任何大语言模型。
这项由谷歌DeepMind研究团队完成的开创性研究首次系统阐述了AI智能体经济的概念框架。研究提出"沙盒经济"模型,从起源性质和边界渗透性两个维度分析AI智能体经济形态,预测未来将出现自然涌现且高度透水的AI经济网络。研究详细探讨了科学加速、机器人协调、个人助手等应用场景,提出基于拍卖机制的公平资源分配方案和使命经济概念,并深入分析了技术基础设施需求、社区货币应用以及相关风险防范措施。
微软宣布从周三开始将Anthropic的AI模型集成到其Copilot助手中,此前该助手主要依赖OpenAI技术。企业用户可在OpenAI的深度推理模型和Anthropic的Claude Opus 4.1、Claude Sonnet 4之间选择,用于复杂研究和构建定制AI工具等任务。此举标志着微软与OpenAI这对曾经独家合作伙伴关系的进一步松动。
中国人民大学研究团队提出LoFT方法,通过参数高效微调基础模型解决长尾半监督学习中的数据不平衡问题。该方法利用预训练模型的良好校准特性改进伪标签质量,并扩展出LoFT-OW版本处理开放世界场景。实验显示,仅使用传统方法1%的数据量就能取得更优性能,为AI公平性和实用性提供了新的解决方案。