人工智能服务平台提供商Aquant Inc.今日推出"检索增强对话"技术,这是一种让大型语言模型检索和呈现信息的全新方法,使AI能够像领域专家一样原生地提供指导,而不是以单一的一体化答案形式接收和呈现知识。
AI大型语言模型在面对用户提问时需要外部知识来更新其通用训练,这通常通过检索增强生成(RAG)来实现。RAG是一种从外部源检索相关信息的工作流程,能够提高准确性并减少幻觉现象。
这些工作流程可以搜索数十万份文档,检索最具上下文相关性的知识,并在大型语言模型一次性提供答案之前将这些信息呈现给它。但是否存在更好的方式将信息传递给AI和用户呢?
产品技术与实验室副总裁、检索增强对话之父Indresh Satyanarayana在接受采访时表示,RAC可以被理解为一个了解自身能力和容量的专家技术员。它帮助AI分析用户的问题,并提出后续问题来填补知识空白,生成定制化解决方案。
"RAG对领域无感知,对用户的真实目标漠不关心,对答案在具体情境中是否真正有用视而不见,"他说道。"RAC用问题解决思维取代了这种问答模式,它参与对话。"
据Satyanarayana介绍,与RAG不同,RAC引入了动态轮流机制,更像是与相关领域专家进行的人类对话。它旨在提供"小块行动",避免用户认知过载。
例如,当用来协助技术员修理车辆发动机时,RAC会逐步了解发动机类型、零件和症状。相比之下,RAG系统会为AI应用生成完整文档,要么一次性全部显示,要么需要开发者解析才能产生对话界面。
不仅如此,RAC还可以根据开发者想要在AI应用中构建的角色,将更多数据点纳入其对话上下文。
"它不仅检索手册,还检索交易数据、作业历史、零件目录、物联网读数和关键绩效指标目标,然后在这个更丰富的上下文中进行推理,推荐最能平衡成本、风险和时间的行动,"Satyanarayana说道。
Satyanarayana表示,检索增强对话并非根本性地取代RAG,它仍将执行检索增强部分。文档仍需要被搜索和检索,这一方面将为用户指导对话。
另一方面,开发者可以决定他们的应用有多"健谈"。它可以进行一对一问题解决,一次解决一个模糊点,然后在所有问题都解决后提供最终答案。
或者,他们可以开发一个能同时解决多个问题的应用,就像某些人能同时保持多个对话线程一样——类似于研究时在Chrome中打开多个标签页——然后再解决问题。
"在某些地方,一些客户仍会选择单一文档RAG响应,"Satyanarayana说道。"但总体而言,我们的目标是重新设计对话层,摆脱生成模式,真正专注于对话。"
Satyanarayana表示,他预计在未来两年内,RAC可能成为引导式AI检索和指导的主要机制。他将其比作教练,因为它将结果视为目标和解决方案而非直接生成,与用户协作而不是向他们倾倒答案。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。