对于11月才推出的技术来说,模型上下文协议(MCP)已经开始积累大量用户,几乎保证了实现行业标准所需的大规模采用。
但是,目前有一部分企业并未加入这一热潮:受监管的行业,特别是金融机构。
银行和其他提供贷款及金融解决方案的企业对AI并不陌生。许多企业在机器学习和算法方面都是先驱,甚至在推广使用机器人投资理念方面发挥了关键作用。然而,这并不意味着金融服务公司希望立即加入MCP和智能体到智能体(A2A)的潮流。
虽然许多受监管的公司,如银行、金融机构和医院,已经开始尝试AI智能体,但这些通常是内部智能体。受监管公司确实拥有API,但这些公司进行的集成需要经过多年的审查以确保合规性和安全性。
Catena Labs联合创始人肖恩·内维尔表示:"在这个快速发展的领域,现在还处于非常早期的阶段,但至少在与互操作性和通信相关的标准或最佳实践方面,还缺少一些基本构建模块。在网络早期,没有电子商务是因为没有HTTPS,没有安全交易的方式,所以无法构建亚马逊。你需要这些基本构建模块到位,现在网络上这些构建模块已经存在,我们甚至不会去思考它们。"
越来越多的企业和AI平台提供商在开发与外部来源智能体交互的多智能体系统时建立MCP服务器。MCP提供识别智能体的能力,允许服务器确定其可访问的工具和数据。然而,许多金融机构希望获得更多保证,确保它们能够控制集成并确保只有经过批准的任务、工具和信息才能被共享。
美国银行子公司Elavon的高级副总裁约翰·沃尔德伦在接受VentureBeat采访时表示,虽然他们正在探索使用MCP,但围绕这一标准还有很多问题。
沃尔德伦说:"目前还没有很多标准解决方案出现,所以我们仍在探索很多方法,包括如果智能体技术在两者之间是通用的,而只是两个不同的域,可能不通过MCP交换来进行连接。但是,在没有其他消息暴露的情况下,数据交换的可追溯性如何?目前MCP评估中发生的很多事情都是在确定协议是否只是处理交换而不提供任何进一步的风险泄露。如果是这样,那么这是我们将探索用于处理交换的可行路径。"
模型和智能体是不同的
金融机构和其他受监管企业对AI模型并不陌生。毕竟,当机器人顾问——算法在很少或没有人工干预的情况下做出财务规划和投资决策——变得流行时,被动投资大幅增长。许多银行和资产管理公司早期就投资了自然语言处理技术以提高文档分析效率。
然而,Salesforce银行业解决方案和战略副总裁兼总经理格雷格·雅各比告诉VentureBeat,他们的一些金融客户已经有了评估模型的流程,他们发现将AI模型和智能体与当前的风险场景集成具有挑战性。
雅各比说:"机器学习和预测模型与风险框架配合得很好,因为它们是确定性和可预测的。这些公司立即将大语言模型提交给他们的模型风险委员会,发现大语言模型产生非确定性结果。这对这些金融服务公司来说是一个存在性危机。"
雅各比表示,这些公司拥有风险管理框架,如果他们向模型提供输入,他们期望每次都得到相同的输出。任何差异都被视为问题,因此他们需要质量控制方法。虽然受监管公司已经接受了API及其涉及的所有测试,但大多数受监管实体"害怕开放性,害怕推出他们无法控制的如此面向公众的东西"。
然而,Elavon的沃尔德伦并不排除金融机构未来可能致力于支持MCP或A2A的可能性。
他说:"从商业角度和需求来看,我认为MCP是业务逻辑发展方向的重要组成部分。"
沃尔德伦表示,他的团队仍处于评估阶段,"我们还没有为试点目的构建服务器,但我们将看到如何处理智能体到智能体的消息交换。"
智能体无法对另一个智能体进行KYC
Catena Labs的内维尔表示,他正在密切关注围绕MCP和A2A等互操作性协议的讨论,特别是因为他相信未来AI智能体将像人类消费者一样成为银行的客户。在创办Catena Labs之前,内维尔联合创立了Circle,这家公司建立了USDC稳定币,因此他对将新技术引入受监管业务的挑战有第一手经验。
由于MCP是开源且新兴的,它仍在不断更新。内维尔表示,虽然MCP提供了对许多公司都很关键的智能体识别功能,但仍缺少一些功能,如通信护栏,最重要的是审计跟踪。这些问题可以通过MCP、A2A甚至像LOKA这样的完全不同的标准来解决。
他说,当前MCP最大的问题之一围绕着身份验证。当智能体成为金融系统的一部分时,即使是MCP或A2A,也没有真正的方法对智能体进行"了解你的客户"。内维尔表示,金融机构需要知道他们的智能体正在与持牌实体打交道,因此智能体必须能够可验证地指向这一点。
"需要有一种方式让智能体说:'这就是我作为智能体的身份,这是我的身份、我的风险以及我代表的是谁。'所有这些不同的智能体框架都能理解的可验证身份将是关键。"
好文章,需要你的鼓励
来自上海交通大学和浙江大学等机构的研究团队开发出首个AI"记忆操作系统"MemOS,解决了AI系统无法实现人类般持久记忆和学习的根本限制。该系统将记忆视为核心计算资源进行调度、共享和演化,在时间推理任务中相比OpenAI记忆系统性能提升159%。MemOS采用三层架构设计,通过标准化记忆单元实现跨平台记忆迁移,有望改变企业AI部署模式。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。