保加利亚图数据库初创公司Graphwise今天宣布对其旗舰产品GraphDB工具进行重大升级,新增功能旨在提升企业知识管理能力,为人工智能模型创建更可靠的基础。
Graphwise(正式名称为Ontotext AD)表示,其平台的改进将使其更适合AI应用,使AI能够从第三方来源获取更多知识,处理新的用例,同时降低基础设施相关成本。
GraphDB是一种专门的"图数据库",能够在业务记录旁存储上下文数据,比如某次销售发生在哪家店铺的信息。传统的结构化查询语言数据库无法轻松做到这一点,因为其架构不允许轻松发现这些连接。而图数据库则可以将连接与传统记录一起存储,促进更快速的分析和查询。
据Graphwise介绍,GraphDB平台旨在解决原始数据与可操作知识需求之间的差距,这种知识能够增强大语言模型的能力。因此,它不是将内容和数据视为独立的关注点,而是创建一个智能结构将它们连接起来。
为此,GraphDB基于"知识图谱",提供企业内容及其与数据库记录关系的动态互联视图。它通过编码关系、层次结构和元数据的方式工作,使AI模型能够推导用户意图,建议相关主题并支持基于场景的推荐。例如,文档将自动标记用户指定的分类法和内容衍生的语义。
这里的关键要素是GraphDB的所谓"语义层",它能够独特地管理结构化数据和非结构化内容,同时保持一致的语义元数据将这些信息联系在一起。
GraphDB 11的新功能
通过最新版本GraphDB 11,Graphwise表示正在让用户更容易地将知识图谱与多个大语言模型集成,简化知识获取,并增加对模型上下文协议的支持,为创建可自主工作的"智能体AI生态系统"铺平道路。
GraphDB 11增加了对更广泛的大语言模型的支持,包括Meta平台公司的Llama、谷歌公司的Gemini、DeepSeek有限公司的R1和阿里巴巴控股有限公司的Qwen等模型。还有改进的检索增强生成工具,称为GraphRAG,它促进对企业知识库的访问,提高AI模型响应的准确性。
通过支持MCP协议,Graphwise使AI智能体能够利用其知识图谱,因此它们可以基于更相关的领域数据。公司表示,结果将是更可靠和准确的AI智能体,能够提供上下文感知洞察,改善决策能力,提高工作流程效率。
此外,该公司还大力改进其"精确实体链接"。这意味着它改进了GraphDB将用户输入的术语和短语映射到知识图谱中正确概念或实体的方式。公司表示,这将有助于消除歧义,改善信息检索和应用到AI模型输出的方式。
除了提升能力外,Graphwise还试图帮助用户降低AI基础设施成本,比如增加对GraphQL语言的支持以简化数据访问。该初创公司还声称新版本具有更高的可用性,以及性能优化,如高级存储库缓存,提高其可扩展性和响应性,使其更具成本效益。
Constellation Research Inc.分析师Michael Ni告诉SiliconANGLE,GraphDB 11是一个有前途的版本,提高了AI就绪企业数据必须交付的标准。
"通过将知识图谱与语义推理结合,简化大语言模型集成和编排,Graphwise提供了一个信任层,使AI基于你的业务运作方式,"分析师说。"这不仅仅是另一个图形版本——这是一个不断上升的蓝图和已交付的简化,用于上下文感知、决策就绪的AI,我们将看到其他企业平台跟随。"
Graphwise总裁Atanas Kiryakov表示,GraphDB 11将有助于解决缺乏"AI就绪数据"的挑战,减少AI项目放弃的情况。他说,大约60%的现有AI项目最终会失败并被取消,因为底层模型无法访问它们需要的数据来交付预期结果。
"GraphDB 11通过提供尖端AI所必需的数据基础设施和治理直接解决了这个问题,"他承诺。"我们通过使客户最复杂的非结构化数据可访问和可操作,赋能客户构建智能、可扩展的应用程序。"
好文章,需要你的鼓励
Runway推出最新AI模型Aleph,旨在重新定义视频创作与编辑方式。基于通用世界模型和模拟模型研究,Aleph提供对话式AI工具,能即时对现有或生成的视频进行复杂编辑。用户只需简单提示,即可删除物体、更换背景或重塑整个场景。与以往专注于文本生成视频的模型不同,Aleph强调"流畅编辑",确保场景、角色和环境的一致性,无需逐帧修复缺陷,为电影制作者和广告商提供更高效的工作流程。
斯坦福大学NLP研究小组发布了全新的2024版GloVe词向量,这是对2014年原版的重大升级。新版本使用维基百科、Gigaword新闻数据和Dolma语料库进行训练,新增超过70万词汇,涵盖疫情、科技、网络文化等现代概念。测试显示新版本在处理当代文本、非西方人名地名和社交媒体内容方面表现显著优于旧版本,为自然语言处理应用提供了更准确的语言理解工具。
TeleAI团队发布TeleChat2、TeleChat2.5和T1三款大语言模型的技术报告,详述了从10万亿tokens预训练到强化学习优化的完整开发过程。T1-115B在数学推理上超越OpenAI o1-mini,展现了国产AI模型的技术突破。研究采用4D并行训练策略,在8000个华为昇腾NPU上完成训练,并全面开源以促进AI技术发展。