人工智能服务平台提供商Aquant Inc.今日推出"检索增强对话"技术,这是一种让大型语言模型检索和呈现信息的全新方法,使AI能够像领域专家一样原生地提供指导,而不是以单一的一体化答案形式接收和呈现知识。
AI大型语言模型在面对用户提问时需要外部知识来更新其通用训练,这通常通过检索增强生成(RAG)来实现。RAG是一种从外部源检索相关信息的工作流程,能够提高准确性并减少幻觉现象。
这些工作流程可以搜索数十万份文档,检索最具上下文相关性的知识,并在大型语言模型一次性提供答案之前将这些信息呈现给它。但是否存在更好的方式将信息传递给AI和用户呢?
产品技术与实验室副总裁、检索增强对话之父Indresh Satyanarayana在接受采访时表示,RAC可以被理解为一个了解自身能力和容量的专家技术员。它帮助AI分析用户的问题,并提出后续问题来填补知识空白,生成定制化解决方案。
"RAG对领域无感知,对用户的真实目标漠不关心,对答案在具体情境中是否真正有用视而不见,"他说道。"RAC用问题解决思维取代了这种问答模式,它参与对话。"
据Satyanarayana介绍,与RAG不同,RAC引入了动态轮流机制,更像是与相关领域专家进行的人类对话。它旨在提供"小块行动",避免用户认知过载。
例如,当用来协助技术员修理车辆发动机时,RAC会逐步了解发动机类型、零件和症状。相比之下,RAG系统会为AI应用生成完整文档,要么一次性全部显示,要么需要开发者解析才能产生对话界面。
不仅如此,RAC还可以根据开发者想要在AI应用中构建的角色,将更多数据点纳入其对话上下文。
"它不仅检索手册,还检索交易数据、作业历史、零件目录、物联网读数和关键绩效指标目标,然后在这个更丰富的上下文中进行推理,推荐最能平衡成本、风险和时间的行动,"Satyanarayana说道。
Satyanarayana表示,检索增强对话并非根本性地取代RAG,它仍将执行检索增强部分。文档仍需要被搜索和检索,这一方面将为用户指导对话。
另一方面,开发者可以决定他们的应用有多"健谈"。它可以进行一对一问题解决,一次解决一个模糊点,然后在所有问题都解决后提供最终答案。
或者,他们可以开发一个能同时解决多个问题的应用,就像某些人能同时保持多个对话线程一样——类似于研究时在Chrome中打开多个标签页——然后再解决问题。
"在某些地方,一些客户仍会选择单一文档RAG响应,"Satyanarayana说道。"但总体而言,我们的目标是重新设计对话层,摆脱生成模式,真正专注于对话。"
Satyanarayana表示,他预计在未来两年内,RAC可能成为引导式AI检索和指导的主要机制。他将其比作教练,因为它将结果视为目标和解决方案而非直接生成,与用户协作而不是向他们倾倒答案。
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。