随着一些受监管企业谨慎扩大AI使用范围,平台和模型开发商开始为特定行业提供定制版本。
Anthropic通过推出新的Claude金融服务版本迈出了这一方向的第一步,这实际上是其Claude企业版的特殊版本,可以缓解该行业对互操作性和工具使用的担忧。Anthropic还将提供与数据提供商的预构建连接器,为Claude上的工具开辟可发现性路径。
Anthropic金融服务行业负责人Jonathan Pelosi在接受VentureBeat采访时表示,Anthropic模型"已经特别适合金融工作负载,我们一直在调整它们以使其变得越来越好"。但是,虽然Claude模型为金融服务公司提供企业解决方案,Pelosi表示该行业也希望从Claude聊天界面获得更多功能。
"与该领域的一些竞争对手不同,他们构建了一个成为轰动的消费者应用,或者他们构建了这些新的视频生成器和表情包生成器,这从来不是我们的重点,"Pelosi说。"我们是企业优先的,所以我们的模型在复杂的企业工作负载中表现最佳,这意味着复杂的定量分析、大规模的金融服务行业复杂数据提取。"
Claude金融服务版将为用户提供额外的速率限制,特别是因为,Pelosi指出,许多分析师经常由于工作负载的规模而快速达到容量限制。与Claude企业版不同,这个金融服务专用平台还将包括与FactSet、PitchBook、S&P Capital IQ和Morningstar等金融数据提供商的预构建MCP连接器,以及来自Anthropic的实施支持。
Claude企业版与Claude金融服务版的第三个主要区别是提示库的存在。Pelosi表示,一些用户在将他们的分析工作流程或需求转化为提示时遇到困难,因此提示库可以指导他们。
Pelosi表示,已经使用Claude企业版的客户没有义务迁移到金融服务版本;但是,增加的限制等附加功能可能会促使他们转换。
Anthropic如何处理金融服务生态系统
Pelosi指出,许多金融服务机构拥有强大的工程师,可以构建AI应用程序。但是,这些公司的核心重点仍然是银行或保险,因此简化将数据连接到AI过程的平台是必不可少的。
"我们试图做的是将所有这些技术集中在一个屋顶下,"Pelosi说。"将其视为一个开箱即用的解决方案,可以轻松配置给Bridgewater或挪威主权财富基金这样的公司,而不是让他们自己拼凑这个东西的替代方案。"
金融服务公司一直在以各种方式构建生成式AI工具,使用现成的模型创建自己的AI平台,或在现有聊天机器人如Claude、Gemini或ChatGPT的基础上构建。例如,BNY一直在为其AI平台Eliza试验AI智能体。Capital One还构建了一个智能体,用于汽车销售,提取汽车经销商库存和汽车贷款数据。
初创公司Metal为金融分析师和私募股权提供助手,读取和解析10-K、10-Q或8-K报告。另一家初创公司Rogo也允许金融机构上传文档并设置工作流程。
缓解担忧
Anthropic并不是唯一为金融行业提供定制解决方案的公司。然而,提供引导设置和经过审查的数据提供商访问可能对一个谨慎避免意外暴露于更多风险的行业大有帮助。
MCP可以通过提供所需的身份识别和工具使用权限,将一家公司或其智能体连接到另一家公司。然而,受监管行业担心它仍然缺乏一些重要的KYC和身份特征。该行业的许多人看到了MCP服务器访问关键金融数据或其他文档的好处,但正在等待大规模采用。
与此同时,金融服务行业因在采用该技术方面过于谨慎而受到批评。
Pelosi重申Anthropic专注于安全和责任,这就是为什么他认为针对金融的解决方案是他们自然的下一步。Pelosi表示,虽然Anthropic的意图"不是为每个垂直领域构建一个Claude",但公司可能会在某个时候将定制功能扩展到其他行业。
Anthropic最近还与Canva、Notion、Stripe和Figma等合作伙伴开放了Claude的更多工具发现性,为应用程序上的搜索和活动提供了更多上下文。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。