生成式 AI 为企业提供了丰富的工具与模型选择,但这些框架并非放之四海而皆准。以检索增强生成(RAG)为例,它能够为用户提供更友好、更贴合语境的输出结果,适合企业高管层在日常决策中使用。与此同时,长上下文模型——一种专为单次处理超大规模输入而设计的架构——则更适合在不依赖检索流程的情况下,对海量数据集和信息资源进行整体性分析。如何判断哪种方案最契合特定业务挑战,正是企业面临的关键问题。当然,两种方式也可以协同运作,将检索能力与更宏观的上下文分析相结合,发挥出更大的综合效能。
在近期一期《InformationWeek播客》中,IBM AI开放创新首席架构师盖布·古德哈特(Gabe Goodhart)与Hippo保险首席数据官罗宾·戈登(Robin Gordon)分别结合各自的实践经验,探讨了如何为企业具体应用场景选择合适的AI资源。
两位嘉宾深入交流了以下议题:他们如何对所使用的模型作出初步判断,是以数据规模为导向还是以预期结果为导向来驱动选型决策,以及在组织需求与所部署AI资源的实际能力之间出现落差时,应当如何加以弥合。
在名为"可疑创意"的圆桌模拟环节中,戈登与古德哈特化身临时高管,运用各自的专业知识,帮助一家虚构企业从各类技术滥用困境中脱身,挑战重重、妙趣横生。
Q&A
Q1:企业在选择AI框架时,检索增强生成(RAG)和长上下文模型有什么区别?
A:检索增强生成(RAG)通过在生成答案时实时检索外部知识库,适合需要精准、友好输出的企业场景,如高管决策支持。长上下文模型则能在单次处理中读取超大规模输入,无需借助检索流程,更适合整体分析海量数据集。两者并非互斥,也可结合使用,兼顾检索的精准性与上下文分析的广度。
Q2:IBM和Hippo保险在AI模型选型时,是优先考虑数据规模还是业务目标?
A:根据节目中两位嘉宾的讨论,企业在进行AI模型选型时,既要考虑数据的规模与类型,也要明确预期的业务结果。通常情况下,目标导向与数据导向会共同影响最终决策,关键在于找到两者之间的平衡点,确保所选框架能够真正匹配实际的业务需求。
Q3:企业部署AI资源后,如果发现与实际需求存在落差该怎么办?
A:当组织需求与AI资源能力之间出现不匹配时,企业需要重新审视选型逻辑,判断是模型能力本身的局限,还是应用方式不当所致。可考虑调整框架组合方式,例如将RAG与长上下文模型协同部署,或针对特定场景对模型进行微调,以弥合能力缺口,避免因框架错配导致项目失败。
好文章,需要你的鼓励
B&H近期对多款M5 Pro MacBook Pro机型推出300美元优惠。14英寸M5 Pro版本(48GB内存+1TB固态硬盘)现售价2299美元,较原价2599美元节省300美元,且该配置在亚马逊无法购买,折扣机会更为难得。此外,16英寸M5 Pro版本(64GB内存+1TB固态硬盘)同样享有300美元折扣。B&H在多款高配MacBook机型上的定价已低于亚马逊,是近期可找到的最优价格。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
Insta360推出GO 3S复古套装,将现代4K运动相机与胶片时代美学结合。套装核心仍是仅重39克的GO 3S,新增复古取景器、胶片风格滤镜、NFC定制外壳及可延长录制时长至76分钟的电池组。复古取景器模仿老式腰平相机设计,鼓励用户放慢节奏、专注构图。相机内置11种色彩预设及负片、正片等滤镜,同时保留FlowState防抖、4K拍摄及10米防水能力,面向热衷复古影像风格的年轻创作者。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。