人工智能服务平台提供商Aquant Inc.今日推出"检索增强对话"技术,这是一种让大型语言模型检索和呈现信息的全新方法,使AI能够像领域专家一样原生地提供指导,而不是以单一的一体化答案形式接收和呈现知识。
AI大型语言模型在面对用户提问时需要外部知识来更新其通用训练,这通常通过检索增强生成(RAG)来实现。RAG是一种从外部源检索相关信息的工作流程,能够提高准确性并减少幻觉现象。
这些工作流程可以搜索数十万份文档,检索最具上下文相关性的知识,并在大型语言模型一次性提供答案之前将这些信息呈现给它。但是否存在更好的方式将信息传递给AI和用户呢?
产品技术与实验室副总裁、检索增强对话之父Indresh Satyanarayana在接受采访时表示,RAC可以被理解为一个了解自身能力和容量的专家技术员。它帮助AI分析用户的问题,并提出后续问题来填补知识空白,生成定制化解决方案。
"RAG对领域无感知,对用户的真实目标漠不关心,对答案在具体情境中是否真正有用视而不见,"他说道。"RAC用问题解决思维取代了这种问答模式,它参与对话。"
据Satyanarayana介绍,与RAG不同,RAC引入了动态轮流机制,更像是与相关领域专家进行的人类对话。它旨在提供"小块行动",避免用户认知过载。
例如,当用来协助技术员修理车辆发动机时,RAC会逐步了解发动机类型、零件和症状。相比之下,RAG系统会为AI应用生成完整文档,要么一次性全部显示,要么需要开发者解析才能产生对话界面。
不仅如此,RAC还可以根据开发者想要在AI应用中构建的角色,将更多数据点纳入其对话上下文。
"它不仅检索手册,还检索交易数据、作业历史、零件目录、物联网读数和关键绩效指标目标,然后在这个更丰富的上下文中进行推理,推荐最能平衡成本、风险和时间的行动,"Satyanarayana说道。
Satyanarayana表示,检索增强对话并非根本性地取代RAG,它仍将执行检索增强部分。文档仍需要被搜索和检索,这一方面将为用户指导对话。
另一方面,开发者可以决定他们的应用有多"健谈"。它可以进行一对一问题解决,一次解决一个模糊点,然后在所有问题都解决后提供最终答案。
或者,他们可以开发一个能同时解决多个问题的应用,就像某些人能同时保持多个对话线程一样——类似于研究时在Chrome中打开多个标签页——然后再解决问题。
"在某些地方,一些客户仍会选择单一文档RAG响应,"Satyanarayana说道。"但总体而言,我们的目标是重新设计对话层,摆脱生成模式,真正专注于对话。"
Satyanarayana表示,他预计在未来两年内,RAC可能成为引导式AI检索和指导的主要机制。他将其比作教练,因为它将结果视为目标和解决方案而非直接生成,与用户协作而不是向他们倾倒答案。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。