根据基准测试公司Evident的最新数据显示,随着其他大语言模型供应商市场份额的增长,OpenAI在顶级银行业的主导地位正在减弱。
Evident发布的最新数据表明,在全球最大50家银行的AI应用案例中,OpenAI提供底层技术支持的比例已从去年的一半下降至三分之一。
Evident联合创始人兼首席执行官Alexandra Mousavizadeh表示,Anthropic的Claude和谷歌的Gemini是在全球最大银行中获得更多关注的两个大语言模型。她指出:"我们注意到OpenAI使用量有所下降,我们认为这是一种自然的多元化趋势。"
她表示,银行对供应商社区提出了更高要求,这为其他供应商建立银行合作关系提供了机会。"竞争的焦点在于谁能与银行建立最佳合作关系,而银行的要求正在变得更加严格,"她说道。银行越来越多地要求供应商派遣部署工程师进入银行,帮助他们构建架构等。
"许多领先银行偏爱模型不可知论的做法,这可能是远离OpenAI转变的部分原因,这已不是秘密,"Mousavizadeh补充道。"然而,我们在最近几个月接触的许多银行家告诉我们,他们对Anthropic和谷歌的交付成果印象深刻。"
"OpenAI仍与BBVA和摩根士丹利等银行保持成功的合作关系,在银行业保持着强大影响力,因此看看这家AI巨头如何在未来几个月发展其企业产品将会很有趣。"
在市场方面,她表示银行正在测试更多应用案例,价值创造正在她所描述的"内部聚焦应用案例"中发生,但她补充说,通过这项技术增加收入的情况尚未实现。
"领先银行开始看到它在成本削减和生产力提升方面产生的影响,"她说。
Mousavizadeh警告称,在英国,企业AI采用情况不如美国,且差距正在进一步扩大。她表示,虽然汇丰银行在全球AI采用方面排在前十位,但它是唯一的英国代表。
"并不是英国银行不够专注,因为像前20名队列中的所有银行一样,它们确实在加倍努力——但在顶端,它们正在三倍努力,"她补充道。
"英国拥有非常优秀的初创社区,但这些企业会离开并带走人才。因此,英国的生态系统正在弱化,这将对英国所有企业及其采用能力产生重大影响。"
此外,Mousavizadeh表示她支持英国政府最近宣布任命两家银行的两名高级技术主管来促进和指导英国银行业AI采用的决定。
"将来自技术社区、具有技术背景的人员安排到监管领域是个好主意,因为他们从技术角度了解风险、局限性和机遇,以及监管机构能做什么以及如何回应,"她说。
Q&A
Q1:为什么银行减少对OpenAI的依赖?
A:根据Evident的数据,OpenAI在全球最大50家银行AI应用中的占比从去年的一半下降至三分之一。这主要是因为银行采取多元化策略,同时Anthropic的Claude和谷歌的Gemini等竞争对手正在获得更多市场份额,银行对供应商提出了更高要求。
Q2:目前银行AI应用主要创造什么价值?
A:目前银行AI应用的价值创造主要体现在内部聚焦的应用案例中,领先银行开始看到AI在成本削减和生产力提升方面的影响。不过,通过AI技术直接增加收入的情况尚未实现。
Q3:英国银行业AI采用情况如何?
A:英国企业AI采用情况不如美国,且差距正在扩大。虽然汇丰银行在全球AI采用排名前十,但它是唯一的英国代表。英国面临初创企业和人才流失问题,导致技术生态系统弱化,影响企业AI采用能力。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。