作为一家提供全托管向量数据库的AI基础设施公司,Pinecone Systems于近日正式推出Pinecone Nexus公测版。这一产品的核心定位是为AI智能体整合并分发企业知识,帮助其更准确、更高效地完成复杂任务。
智能体时代已经到来,而其运转的基础正是数据。数据以何种方式传递给AI智能体,正在成为决定答案准确与否的关键管道。如何将原始信息加工、封装,并以AI能够理解的方式呈送出去,成为业界持续攻克的核心命题。
对于人类员工而言,整合多来源数据并非难事。他们凭借多年积累的"机构记忆",清楚地知道该去哪里查找Wiki文档、人力资源档案、会议记录、支持工单还是财务数据。然而,AI智能体并不具备这种能力。每一次调用,它都需要依赖框架、图谱和知识体系,来重建那种"我不知道答案,但我知道去哪儿找"的认知能力。
Pinecone Nexus的设计正是为了解决这一痛点:它为AI智能体提供结构化的知识访问能力,使其能够同时跨越数十个文件进行推理,而不仅仅是抓取零散的文本片段。
Nexus带来了什么
AI智能体要运转,首先需要获取数据。Nexus为此提供了数据连接器,支持从多个来源检索和导入内容。当前已上线的接入方式包括本地文件上传、Box和Microsoft OneLake,而Google Drive、Slack、GitHub、Notion、Confluence和S3等连接器也已在开发计划中,即将推出。
工程团队在搭建AI智能体时,可在名为"工作区"(Workspace)的项目容器中进行操作。工作区将数据组织为"上下文"(Contexts),将数据定义为知识集合或领域模块。各团队可自行构建工作区,并以此维护专属于各自AI智能体的认知知识库。
这些数据会经由Nexus的知识整理层进行处理,该层通过名为"清单"(Manifests)的模板,将原始文档转化为与其内容相匹配的知识制品。
从本质上看,Nexus构建了一套框架,向AI智能体阐明"在哪里找什么"的底层逻辑——就像一位在公司工作超过三年的员工,清楚地知道要查询并购数据该去哪份财务档案,或者最新的网站业务逻辑存放在哪里。
这与提示词工程有所不同。在提示词工程中,用户或工程师需要在每次查询时手动告知智能体去哪里寻找信息;而Manifests则让智能体在知识整理阶段就已了解信息的存放位置。这一机制将领域专家纳入信息分类流程,确保信息在AI智能体需要时处于可用状态。
在基准测试中,Pinecone表示Nexus展现出高性能与高准确率。
"我们可以轻松搭建向量数据库,并在文档库上运行RAG(检索增强生成)及智能体搜索。"Q2 Holdings首席数据科学家Jesse Barbour表示,该公司是一家总部位于奥斯汀的金融科技解决方案公司,"真正的难题在于,如何让智能体在面对真正复杂的问题时,可靠且高效地组装出正确的知识。"
Barbour指出,Nexus在处理复杂支持问题时准确率达到95%,同时保持了较低的Token消耗成本。随着AI推理价格持续上涨,这一点使其成为极具吸引力的知识层方案。
另一项测试来自一家未具名的数据保护与安全厂商。该厂商使用Nexus处理了一批覆盖面广泛的文档,其中包括市政会议记录——这意味着用户的提问可能跨越多个文档和片段。
测试结果显示,将598份文档整理为12种结构化制品类型,总成本仅为2.31美元,耗时34分钟。后续查询的准确率约为90%,而行业标准RAG管道的基线准确率仅为65%。
Q&A
Q1:Pinecone Nexus是什么?主要解决什么问题?
A:Pinecone Nexus是由Pinecone Systems推出的企业知识整合产品,当前处于公测阶段。它的核心作用是为AI智能体提供结构化的知识访问能力,解决AI智能体不知道"去哪里找信息"的问题。通过连接器、工作区、上下文和清单模板等机制,Nexus能将企业散落在各处的文档整理成AI可用的知识制品,使智能体在面对复杂问题时也能准确调取相关信息。
Q2:Pinecone Nexus支持接入哪些数据源?
A:目前Nexus已支持本地文件上传、Box和Microsoft OneLake三种数据接入方式。此外,Google Drive、Slack、GitHub、Notion、Confluence和Amazon S3等主流平台的连接器正在开发中,即将陆续上线。这些集成将帮助企业将分散在不同系统中的信息统一纳入AI智能体的知识库。
Q3:Pinecone Nexus的实际表现如何?有没有具体数据?
A:根据Pinecone公布的测试数据,在金融科技公司Q2 Holdings的应用场景中,Nexus处理复杂支持问题的准确率达到95%,并有效控制了Token使用成本。另一项来自数据安全厂商的测试显示,Nexus对598份文档的整理成本仅为2.31美元,耗时34分钟,后续查询准确率约为90%,显著高于行业标准RAG管道65%的基线水平。
好文章,需要你的鼓励
Anthropic于6月30日发布Claude Sonnet 5,相较前代Claude Sonnet 4.6在编程、推理、工具使用及知识工作方面均有显著提升。该模型可自主制定计划、使用浏览器和终端等工具,达到数月前需更大更贵模型才能实现的水平。安全评估显示其不良行为率更低。Sonnet 5默认开启自适应思维,采用更新的分词器,性能接近Opus 4.8但价格更低,现已面向所有订阅计划开放。
复旦大学联合多机构提出A2World框架,通过210万条真实机器人轨迹进行动作条件化预训练,将学到的物理动力学先验同时迁移到仿真模拟和策略控制两个方向,在LIBERO和真实机器人任务上均取得当前最优表现。
人工智能基础设施的快速扩张不仅带来总用电量激增,更在改变电网的运行特性。AI训练任务高度同步、计算密集,推理任务则分散且难以预测,两者均可在极短时间内造成电力需求骤变。数据中心的地理集中分布进一步加剧局部电网压力。现有监管框架多基于稳定工业负荷设计,难以适应这类新型需求。专家指出,电网规划需从关注总能耗转向关注需求波动性与同步效应。
同济大学研发的FLISP系统,让无人车与无人机在水电隧道中无需建图、仅靠激光雷达实时协作导航,规划延迟仅7毫秒,成功率100%。