虽然许多企业正在争相采用和部署 AI,但信用评级巨头 Experian 却采取了非常谨慎的方法。
Experian 开发了自己的内部流程、框架和治理模型,帮助其测试生成式 AI,大规模部署并产生影响。公司的发展历程见证了其从传统信用评级机构向sophisticated 的 AI 驱动平台公司的转型。其方法将先进的机器学习 (ML)、代理式 AI 架构和基层创新相结合,改善了业务运营,并使约 2600 万美国人获得了金融服务。
Experian 的 AI 之旅与那些直到 2022 年 ChatGPT 出现后才开始探索机器学习的公司形成鲜明对比。这家信用巨头已经用了近 20 年时间有条不紊地发展 AI 能力,为快速利用生成式 AI 突破打下了基础。
"AI 早已深深融入 Experian 的基因中,远在它成为热门话题之前,"Experian 软件、平台和 AI 产品执行副总裁兼总经理 Shri Santhanam 在接受 VentureBeat 独家采访时表示。"在过去二十年里,我们一直在利用 AI 释放数据的力量,为企业和消费者创造更好的影响。"
从传统机器学习到 AI 创新引擎
在现代生成式 AI 时代之前,Experian 已经在使用和创新机器学习。
Santhanam 解释说,Experian 没有依赖基础的传统统计模型,而是率先将梯度提升决策树与其他机器学习技术结合用于信用承保。公司还开发了可解释的 AI 系统 - 这对金融服务的监管合规至关重要 - 能够解释自动贷款决策背后的原因。
最重要的是,Experian 创新实验室 (前身为数据实验室) 在 ChatGPT 发布之前就已经在试验语言模型和 Transformer 网络。这项早期工作使公司能够快速利用生成式 AI 的进步,而不是从头开始。
"当 ChatGPT 像陨石一样突然出现时,对我们来说这是一个相当直接的加速点,因为我们理解这项技术,心中已有应用方向,我们只需要加大力度推进,"Santhanam 解释道。
这一技术基础使 Experian 能够跳过许多企业仍在摸索的实验阶段,直接进入生产实施。当其他组织还在努力理解大语言模型 (LLM) 的功能时,Experian 已经在其现有 AI 框架内部署它们,将其应用于之前已确定的具体业务问题。
企业 AI 转型的四大支柱
当生成式 AI 出现时,Experian 没有恐慌或转向,而是沿着已规划的道路加速前进。该公司围绕四个战略支柱组织其方法,为技术领导者提供了全面的 AI 采用框架:
产品增强:Experian 检查现有的面向客户的产品,以识别 AI 驱动改进和全新客户体验的机会。Experian 不是创建独立的 AI 功能,而是将生成式功能集成到其核心产品套件中。
生产力优化:第二个支柱通过在工程团队、客户服务运营和内部创新流程中实施 AI 来解决生产力优化。这包括为开发人员提供 AI 编码辅助,并简化客户服务运营。
平台开发:第三个支柱 - 也许是 Experian 成功的最关键因素 - 以平台开发为中心。Experian 早就认识到许多组织会难以突破概念验证实施阶段,因此投资建设专门用于企业范围内负责任地扩展 AI 计划的平台基础设施。
教育和赋能:第四个支柱解决教育、赋能和沟通问题 - 创建结构化系统以在整个组织中推动创新,而不是将 AI 专业知识限制在专门的团队中。
这种结构化方法为企业提供了一个蓝图,帮助它们从零散的 AI 实验转向具有可衡量业务影响的系统实施。
技术架构:Experian 如何构建模块化 AI 平台
对于技术决策者来说,Experian 的平台架构展示了如何构建能平衡创新、治理、灵活性和安全性的企业 AI 系统。
该公司构建了一个多层技术栈,其核心设计原则优先考虑适应性:
"我们避免走单向门,"Santhanam 解释说。"如果我们在技术或框架上做出选择,我们要确保...我们做出的选择在需要时可以调整。"
该架构包括:
模型层:多个大语言模型选项,包括通过 Azure 的 OpenAI API、AWS Bedrock 模型 (包括 Anthropic 的 Claude) 和经过微调的专有模型。
应用层:使工程师能够构建代理架构的服务工具和组件库。
安全层:与 Dynamo AI 早期合作,专门为 AI 系统设计安全、政策治理和渗透测试。
治理结构:直接涉及高管的全球 AI 风险委员会。
这种方法与那些致力于单一供应商解决方案或专有模型的企业形成对比,为 Experian 在 AI 能力持续发展时提供了更大的灵活性。目前,该公司正在看到其架构向 Santhanam 所描述的"AI 系统更多地被构建为由更专注的专家或小型语言模型驱动的专家和代理混合体"转变。
可衡量的影响:规模化的 AI 驱动金融包容性
除了架构的复杂性之外,Experian 的 AI 实施还展示了具体的商业和社会影响,特别是在解决"信用不可见人群"问题方面。
在金融服务行业,"信用不可见人群"指的是约 2600 万美国人,他们缺乏足够的信用记录来生成传统信用评分。这些人,通常是年轻消费者、近期移民或来自历史上服务不足社区的人,尽管可能具有信用价值,但在获取金融产品时面临重大障碍。
传统信用评分模型主要依赖标准信用局数据,如贷款还款历史、信用卡使用率和债务水平。没有这种传统历史,贷款机构历来将这些消费者视为高风险或完全拒绝为他们提供服务。这造成了一个两难困境,人们因为无法获得信用产品而无法建立信用。
Experian 通过四个具体的 AI 创新来解决这个问题:
替代数据模型:机器学习系统将非传统数据源 (租金支付、水电费、电信费用) 纳入信用评估,分析数百个变量,而不是仅限于传统模型中的有限因素。
合规可解释 AI:通过阐明具体评分决策的原因来保持监管合规的框架,使复杂模型能够在高度监管的贷款环境中使用。
趋势数据分析:AI 系统检查金融行为如何随时间演变,而不是提供静态快照,检测余额轨迹和支付行为中能更好地预测未来信用价值的模式。
细分特定架构:针对不同信用不可见人群细分的定制模型设计 - 那些信用记录薄弱的人与完全没有传统历史的人。
结果令人瞩目:使用这些 AI 系统的金融机构可以在维持或改善风险表现的同时,批准多 50% 来自之前不可见人群的申请者。
技术决策者的可行启示
对于希望在 AI 采用方面处于领先地位的企业,Experian 的经验提供了几个可行的见解:
构建适应性架构:构建允许模型灵活性的 AI 平台,而不是完全押注于单一供应商或方法。
尽早整合治理:创建跨职能团队,让安全、合规和 AI 开发人员从一开始就协作,而不是在孤岛中运作。
关注可衡量影响:优先考虑像 Experian 的信用扩展这样既能带来切实业务价值又能解决更广泛社会挑战的 AI 应用。
考虑代理架构:超越简单的聊天机器人,转向可以更有效处理复杂领域特定任务的协调多代理系统。
对于金融服务和其他受监管行业的技术领导者来说,Experian 的旅程表明,负责任的 AI 治理不是创新的障碍,而是可持续、值得信赖增长的推动力。
通过将系统的技术开发与前瞻性的应用设计相结合,Experian 为传统数据公司如何转型为具有重要商业和社会影响的 AI 驱动平台创造了蓝图。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。