金融服务业一直习惯于处理庞大的数字。
据估计,包括银行、保险、投资、借贷等财富分配相关业务在内的金融服务行业总值将在 2024 年达到 33.54 万亿美元,同比 2023 年增长率 (CAGR) 为 7.7%。根据部分统计,这约占全球经济总量的 31%。
未来前景更加光明。Growth Market Reports 分析师预计,到 2031 年,全球金融服务市场规模将超过 58.69 万亿美元,年均复合增长率将达到更高的 9.7%。
为支持这样的增长而制定 IT 战略,又产生了另一个令人惊叹的数据 - 这些增长轨迹将产生的海量数据总量。
IDC 预测,到 2026 年,整体数据量将以 21.2% 的年均复合增长率增长至 221,000 艾字节。这些信息中的大部分需要被存储、查询和分析,而不是简单地归档,这意味着需要通过低延迟连接确保数据易于获取。延迟只是需要关注的关键要素之一,其他还包括数据主权、数据隐私和网络安全。
针对金融服务行业的数据增长预测在细节上可能有所不同,但在两点上达成共识:数据资产正在以加速度积累,而这些信息对建立和保持竞争优势变得越来越重要。
为了在数字时代留住和吸引新客户,创新的 AI 驱动应用和服务的使用同样重要。因此,深思熟虑的金融服务 IT 规划者必须在标准化数据驱动计划的同时,扩展其针对 AI 系统设计的用例范围。
Digital Realty 首席收入官 Colin McLean 敦促,金融服务业的 IT 领导者必须迅速行动才能保持竞争地位。他说:"如今金融服务业正大规模转向 AI,他们发现,AI 需要一种与传统 pre-AI 技术完全不同的 IT 供应方法。"
根据英格兰银行对金融服务公司的调查,AI 最受关注的应用场景是数据分析洞察以及打击欺诈和洗钱。未来三年预期效益增长最大的领域是运营效率、生产力提升和成本降低。
AI 辅助打击犯罪已经在这些领域带来了收益。处理人工欺诈审查的工作人员现在可以得到基于大语言模型的助手的帮助,这些助手在后端运行检索增强生成 (RAG),从政策文档中获取信息,加快判断案件是否涉及欺诈的决策过程,从而加快处理速度并减少损失。
AI 就绪的数据中心
虽然金融服务业已意识到 AI 投资可能带来的革命性收益,但在认识到这些机会需要大量数据中心资源来配置和支持运行 AI 工作负载所需的 IT 设施方面却相对滞后。
这一趋势在 Digital Realty 2024 年"全球数据洞察调查"中得到证实。64% 的受访 IT 决策者表示,缺乏存储 AI 所需的海量数据集的数据存储设施是采用 AI 战略的"最大障碍"。
McLean 指出:"很少有人会质疑 AI 的使用正在推动各个行业的新一轮创新浪潮,而金融服务业目前可以说比其他行业更迫切需要 AI。例如,它必须采取全面的视角来应对监管合规带来的挑战。金融服务公司的响应必须是整体性的,而不是单一的。采用速度至关重要。"
虽然金融服务公司需要快速部署 AI,但他们面临着双重困境:一方面,AI 就绪的数据中心设施的供应将被需求超过,另一方面,新数据中心的上线速度出了名的慢。
McLean 解释说:"获得扩建现有数据中心的规划许可可能会拖延很长时间。例如,美国某些地区蓬勃发展的技术产业导致对能源的额外需求,在某些地区新的公用事业电力项目等待时间可能长达五年。"
麦肯锡公司的一项研究表明,2023 年至 2030 年间,全球数据中心容量需求可能以每年 19% 到 22% 的速度增长。为避免供需赤字,需要在不到 25% 的时间内建设至少是 2000 年以来建成的数据中心容量的两倍,麦肯锡建议。
为 AI 就绪做好准备
对 AI 就绪数据中心容量的需求是这一潜在赤字的主要驱动力。麦肯锡的分析表明,到 2030 年,这一需求将以每年约 33% 的平均速度增长。这意味着到 2030 年,数据中心容量总需求中约 70% 将用于配备托管 AI 工作负载的设施。
这正是 Digital Realty 在全球范围内准备帮助客户快速部署的起点。该公司表示,他们已经预见到这波公共和私有 AI 基础设施的新需求浪潮,并已为此做好准备很长时间。McLean 说,这给了他们无可匹敌的优势。
他说:"公司长期以来一直将数据中心视为跨企业全期数字化转型和 AI 采用的基础。我们已经能够支持 CPU 或 GPU 上的高密度工作负载 - Digital Realty 全球 50% 的数据中心现在已完全'AI 就绪'。"
Digital Realty 对新的 AI 驱动需求的看法的核心是其数据引力 (DataGravity) 管理概念。数据引力指的是数据具有质量,随着其规模和重要性的增长,移动或复制变得越来越困难。
McLean 解释说:"数据引力是企业数据创建和交换造成的吸引力,吸引着应用程序、服务器和其他数据。随着数据创建和交换的增长,由于这种吸引力,它呈指数级加速,形成更多数据创建的循环。"
他补充说,一旦生根,数据引力可能造成阻碍全球范围内数据交换效率、安全性、客户体验和创新的挑战。因此,IT 投资应考虑数据引力数据的指数级增长。
McLean 报告说:"我们看到数据引力导致数据越来越多地分布在多个位置,包括本地站点和云端。分布式布局使得有效管理、治理和保护数据变得困难,增加了潜在的合规挑战和业务风险。"
更近更好
PlatformDIGITAL 是 Digital Realty 的全球数据中心解决方案,使客户能够托管其关键基础设施并与全球数字生态系统互联。它旨在为客户提供管理数据引力和其他众多挑战的普及性数据中心架构 (PDx) 解决方案方法。
企业通过 PlatformDIGITAL 解决数据引力和性能问题的最有效方式之一可能是"本地化"其 IT 基础设施,使 AI 战略与 IT 本身的位置相关联。
McLean 说:"本地化有助于将数据和计算资源分配到更接近最终用户的位置,并降低延迟。由于数据是驱动 AI 模型和 AI 驱动洞察的燃料,至关重要的是正确的数据要在最接近其所在位置的地方以稳定状态随时可用于 AI 处理。"
金融服务企业可能还需要策略来管理数据收集和存储的位置,以及这些数据如何与全球隐私法规和合规要求保持一致。这就是为什么 McLean 认为数据本地化正在成为金融服务业 IT 领导者的优先事项。
他说:"分布式数据战略加速 AI 部署效率。IT 位置不仅需要有合适的硬件来支持 AI 等新兴技术计划,IT 领导者还需要制定与区域法规相对应的计划。"
扩展和分配 HPC 风险计算
Digital Realty 和合作伙伴联想最近为一家欧洲金融服务客户开发的解决方案提供了一个例子,说明 AI 就绪基础设施如何帮助分析海量数据以深入了解其客户行为,同时提高运营效率并管理金融风险。
Maclean 解释说:"相关的 IT 工作负载集中在欧洲一个数据中心的计算网格上。随着应用程序性能和延迟问题恶化,客户看到了扩展和分配其 HPC 风险计算能力的紧迫需求。"
建设自己的数据设施以满足必要要求需要数年时间。因此,为了使所需的 HPC 能力接近其欧洲总部并靠近周边都市区内的其他 HPC 集群,客户选择采用混合 IT 战略,管理自己的数据中心用于现有工作负载,同时利用托管来促进支持风险计算工作负载所需的扩展。
McLean 说:"Digital Realty 和联想的合作使这家金融服务提供商能够扩展和分配对其风险管理战略至关重要的 HPC 能力。通过利用 PlatformDIGITAL 进行托管来扩展数据中心容量,公司节省了时间,并减少了建设自己设施所需的资本支出。此外,由于 Digital Realty 能够改造现有数据中心,部署速度提高了约六倍。"
好文章,需要你的鼓励
这项研究由新加坡国立大学团队开发的DualParal技术,通过创新的双重并行架构解决了AI视频生成的长度限制问题。该方法同时在时间帧和模型层两个维度实现并行处理,配合分块降噪机制、特征缓存和协调噪声初始化策略,使生成分钟级长视频成为可能。实验表明,在生成1,025帧视频时,DualParal比现有技术减少了高达6.54倍的延迟和1.48倍的内存成本,同时保持了高质量的视频输出,为内容创作者提供了生成更长、更复杂视频叙事的新工具。
SoloSpeech是约翰霍普金斯大学研究团队开发的创新语音处理技术,针对"鸡尾酒会效应"问题提出了全新解决方案。该系统通过级联生成式管道整合压缩、提取、重建和校正过程,实现了高质量目标语音提取。与传统判别式模型相比,SoloSpeech采用无需说话者嵌入的设计,直接利用提示音频的潜在空间信息与混合音频对齐,有效避免特征不匹配问题。在Libri2Mix及多个真实世界数据集上的评测显示,SoloSpeech在清晰度、质量和泛化能力上均达到了领先水平,为语音分离技术开辟了新方向。
这项由北京大学深圳研究生院、伟湾大学、腾讯ARC实验室和兔小贝智能联合研究的Sci-Fi框架,通过创新的对称约束机制,解决了视频帧间插值中的关键问题。研究团队设计了轻量级EF-Net模块,增强结束帧约束力,使其与起始帧形成平衡影响,从而生成更自然流畅的中间过渡帧。实验证明,该方法在各种场景下都优于现有技术,特别适用于电影制作、动画创作和视频编辑领域,显著降低了人力成本。
这项来自西北大学和谷歌的研究突破了传统马尔可夫强化学习的局限,通过贝叶斯自适应RL框架解释了大语言模型中涌现的反思性推理行为。研究团队提出的BARL算法通过维护多个解题策略的后验分布,指导模型何时何地进行反思性探索,在数学推理任务上展现出显著优势,比基线方法减少高达50%的标记使用量,同时提高了准确率。这一研究不仅解释了"为什么反思有用",还提供了实用的指导原则,为AI系统的自适应推理能力开辟了新方向。