当法律研究公司 LexisNexis 创建其 AI 助手 Protégé 时,他们希望在不部署大型模型的情况下找到最佳方式来利用其专业知识。
Protégé 旨在帮助律师、律师助理和法务人员撰写和校对法律文件,确保他们在诉状和简报中引用的内容准确无误。然而,LexisNexis 并不想要一个通用的法律 AI 助手,他们希望打造一个能够学习律所工作流程且更具定制化的助手。
LexisNexis 的首席技术官 Jeff Riehl 向 VentureBeat 表示,他们看到了利用 Anthropic 和 Mistral 的大语言模型 (LLMs) 的机会,并找到最能回答用户问题的最佳模型。
"作为我们多模型方法的一部分,我们为特定用例使用最佳模型。我们使用能够以最快响应时间提供最佳结果的模型," Riehl 说。"对于某些用例,可能是像 Mistral 这样的小型语言模型,或者我们通过模型蒸馏来提高性能并降低成本。"
虽然大语言模型在构建 AI 应用程序时仍然很有价值,但一些组织转向使用小型语言模型 (SLMs) 或将大语言模型蒸馏成同一模型的小型版本。
蒸馏技术(即让大语言模型"教导"较小的模型)已经成为许多组织采用的流行方法。
小型模型通常最适合用于聊天机器人或简单的代码补全等应用,这正是 LexisNexis 想要在 Protégé 中使用的功能。
这并不是 LexisNexis 第一次构建 AI 应用程序,早在 2024 年 7 月推出其法律研究中心 LexisNexis + AI 之前就已经开始了。
"我们过去使用过很多 AI,主要围绕自然语言处理、一些深度学习和机器学习," Riehl 说。"这种情况在 2022 年 11 月 ChatGPT 推出后发生了真正的改变,因为在此之前,很多 AI 功能都是在幕后运行的。但一旦 ChatGPT 问世,它的生成能力和对话能力对我们来说非常吸引人。"
小型微调模型和模型路由
Riehl 表示,LexisNexis 在构建其 AI 平台时使用了来自大多数主要模型提供商的不同模型。LexisNexis + AI 使用了 Anthropic 的 Claude 模型、OpenAI 的 GPT 模型和 Mistral 的模型。
这种多模态方法帮助分解用户希望在平台上执行的每个任务。为此,LexisNexis 必须构建其平台以在模型之间切换。
"我们会将正在执行的任务分解为各个组件,然后确定支持该组件的最佳大语言模型。一个例子是我们使用 Mistral 来评估用户输入的查询," Riehl 说。
对于 Protégé,公司希望获得更快的响应时间和更适合法律用例的微调模型。因此,他们转向了 Riehl 所说的模型"微调"版本,本质上是大语言模型的较小权重版本或蒸馏模型。
"你不需要 GPT-4o 来进行查询评估,所以我们将其用于更复杂的工作,并且我们会切换模型,"他说。
当用户向 Protégé 询问特定案例时,它首先会调用一个微调的 Mistral 模型"来评估查询,然后确定该查询的目的和意图",之后再切换到最适合完成任务的模型。Riehl 说,下一个模型可能是为搜索引擎生成新查询的大语言模型,或者是另一个总结结果的模型。
目前,LexisNexis 主要依赖于微调的 Mistral 模型,不过 Riehl 表示,他们"在 Claude 刚推出时使用过其微调版本;我们现在不在产品中使用它,但在其他方面使用。" LexisNexis 也对使用其他 OpenAI 模型感兴趣,特别是自去年该公司推出新的强化微调功能以来。LexisNexis 正在评估 OpenAI 的推理模型(包括 o3)用于其平台。
Riehl 补充说,他们可能还会考虑使用 Google 的 Gemini 模型。
LexisNexis 用自己的知识图谱支持其所有 AI 平台以实现检索增强生成 (RAG) 功能,特别是因为 Protégé 可能在未来帮助启动代理流程。
AI 法律套件
早在生成式 AI 出现之前,LexisNexis 就测试过在法律行业使用聊天机器人的可能性。2017 年,该公司测试了一个 AI 助手,与 IBM 的 Watson 驱动的 Ross 竞争,而 Protégé 则是该公司 LexisNexis + AI 平台的一部分,该平台整合了 LexisNexis 的 AI 服务。
Protégé 帮助律所完成法务人员或助理通常会做的任务。它帮助撰写基于律所文件和数据的法律简报和诉状,建议法律工作流程的下一步,建议新的提示来优化搜索,起草取证和证据开示问题,链接文件中的引用以确保准确性,生成时间轴,当然还包括总结复杂的法律文件。
"我们将 Protégé 视为个性化和代理能力的初始步骤," Riehl 说。"想想不同类型的律师:并购、诉讼、房地产。它将基于你做的具体任务而不是其他律师做的事情,变得越来越个性化。我们的愿景是,每个法律专业人士都将拥有一个基于他们工作内容的个人助理。"
Protégé 现在与其他法律研究和技术平台竞争。Thomson Reuters 为其 CoCounsel 法律助手定制了 OpenAI 的 o1-mini 模型。获得包括 LexisNexis 在内的投资者 3 亿美元投资的 Harvey 也有一个法律 AI 助手。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。