渣打银行 (SCB) 正在通过以严格治理且以成果为导向的数据为基础,解决人工智能 (AI) 应用中所面临的种种复杂问题,该行集团首席数据官 Mohammed Rahim 如是介绍。
Rahim 于 2024 年 12 月被任命为该职位,此前他在渣打银行内部多个数据职能部门工作了 19 年,如今他正引领银行数据相关工作,直接支撑其 AI 野心,同时在内部和外部重新塑造银行的叙事方式。
Rahim 在接受 Computer Weekly 采访时表示:“我们正逐步抛弃‘数据驱动’这一表述。我们已经重新定位我们的叙事,因为这不仅仅是为了数据而收集数据,而是为了达成既定成果而利用数据,其核心目的是更好地服务我们的客户。”
这一理念构成了渣打银行在数据管理和 AI 部署方面的基本策略。目前,该行正处于完成一项正式的 AI 战略阶段,计划在今年年中向董事会做出汇报,该战略摒弃了仅为技术而技术的做法。
Rahim 补充道:“我们的 AI 战略绝不是纯粹为了 AI 而使用 AI,而是为了实现我们的业务目标。”他进一步说明,这些目标主要围绕将渣打银行定位为面向高净值及跨境客户的领先银行,并特别关注可持续发展。
在运营方面,渣打银行正在建立一个中央 AI 平台,同时对现有数据平台进行升级改造。Rahim 的团队与技术同事合作,共同负责构建所需的保障机制。
他解释说:“在我的部门中,我们将设立一个中央团队,为 AI 建立保护措施,例如负责 AI 的责任管理,并确保拥有合适的平台和技术生态系统来支撑我们的 AI 战略。”
这一中央能力支撑着一个“中心—分支”运营模式,旨在将 AI 能力和应用案例开发推广至银行各个业务部门和职能领域,既满足各自特定需求,又保持中央统一监督。
在落地 AI 的初步步骤中,最近推出的 SC GPT 起到了关键作用,该内部大语言模型类似于 ChatGPT,目前已向 41 个市场的 70,000 名员工开放使用。Rahim 表示,该工具已处理超过 150,000 个指令,并且与以“中心—分支”结构针对高影响力 AI 应用案例的更有针对性的开发形成互补。
Mohammed Rahim,渣打银行 “我们已经重新定位我们的叙事,因为这不仅是为了数据而数据,而是为了达成成果 —— 更好地服务客户。”
至关重要的是,这些 AI 项目的成功在很大程度上依赖于基础数据的质量、相关性和治理水平。渣打银行运营着一个全行范围的数据湖,目前正进行现代化改造。
Rahim 说明,重中之重是确保数据适用于特定用途。“这意味着我们要明确希望实现的成果,并确保所采集的数据点能够满足该成果的需求。”他补充道。
在开发 AI 模型时,渣打银行根据具体应用场景评估数据需求,同时也越来越注重能力的整合,以避免重复劳动。例如,Rahim 指出,与其让多个团队各自构建语言翻译工具,银行更倾向于确保拥有适用于中央翻译能力的准确数据。
除了数据的准确性,Rahim 强调数据还必须能代表真实世界。他提到了数据漂移这一概念,即数据虽然准确,但因发生变化可能会导致 AI 模型输出出现偏差。
Rahim 举例说明:“在疫情前,信用卡公司会根据你旅行的频率向你推荐里程卡;但疫情期间,所有人的航空里程都归零,信用卡公司检查其算法时发现根本没有推荐任何产品。数据本身是准确的,但算法没有针对数据进行调整,已经不能真实反映现实情况。”
为此,Rahim 表示,渣打银行致力于确保数据和算法随着世界变化持续适应预期成果。
渣打银行使用数据的主要目的是提升客户体验,而非直接实现货币化。Rahim 描述了一个试点项目,该项目利用 AI 协助呼叫中心座席。通过将保单文件输入 AI 模型,座席能够迅速查询复杂场景(例如提前还贷的影响),从而为客户提供更快捷、准确的答复。他指出:“提升客户体验正是我们在聚焦 AI 战略时的核心所在。”
在解决大型组织内部数据孤岛问题时,Rahim 也承认需要在打破壁垒和遵守日益复杂的法规之间寻求平衡,这在跨境数据流动方面尤为明显。“我们如何在打破数据孤岛的同时又不违反法律?这正是难题所在。”
渣打银行的方案是对其数据湖基础设施进行现代化升级,引入更为完善的访问控制机制。Rahim 解释道:“我们仍然认为建立一个中央数据湖是正确的方向,但它必须经过现代化改造,以适应不同的限制要求。”
他将这一概念形容为“围绕数据构建一层楼笼”,即通过基于角色、地理位置和数据驻留法律等因素的控制措施,规定谁可以查看哪些数据。目前,渣打银行的数据湖基础设施主要部署在本地,但银行正在评估本地与云端混合部署的最佳方案,以应对复杂要求。
此外,渣打银行还成立了一个负责 AI 的委员会,该委员会制定了一个框架,整合了数据隐私、网络安全、架构治理和风险管理等多方面的观点。AI 模型在部署前必须经过严格检测,特别是在隐私保护和潜在偏见方面。Rahim 表示:“我们非常重视应用负责任的 AI 标准,我们会尽可能避免在算法中使用非常敏感的数据,因为我们不希望造成意外的偏见。”
展望未来,渣打银行正在组建生成式 AI 小组,致力于开发与战略目标相契合的高影响力案例,涉及运营、财务和合规等领域。与此同时,银行正更新其负责任的 AI 框架,以应对生成式 AI、具备代理能力的 AI 以及开源模型所带来的特定挑战,例如托管地点、潜在偏见和安全风险。
渣打银行还积极提升全体员工的 AI 素养,包括开展“promptathons”活动,通过系列工作坊教授员工如何高效与 AI 模型互动。同样重要的是强化个人责任感,确保员工明白,虽有 AI 协助,但最终输出的责任仍由人来承担。“虽然 AI 可以为你重写邮件,但责任依然在你身上。”他如是说。
好文章,需要你的鼓励
Instagram负责人莫塞里在接受采访时透露,平台正考虑引入长视频内容功能,尽管此前一直专注于短视频。他承认为了吸引优质内容,Instagram可能需要支持长视频格式。此外,Meta最近推出了"您的算法"功能,旨在让用户更好地控制信息流内容。莫塞里承诺未来将提供更多工具,让用户主动塑造个性化内容,但完整实现可能需要2-4年时间。
香港大学联合Adobe研究院提出PS-VAE技术,成功解决了AI无法同时具备图像理解和生成能力的难题。通过创新的两阶段训练策略,让AI既能准确理解图片语义,又能生成高质量图像,在图像编辑任务上性能提升近4倍,为统一视觉AI系统开辟新路径,在数字创作、教育、电商等领域具有广阔应用前景。
在信息爆炸的时代,AI实验室的研究员们常常需要面对海量的论文、专利文件、论坛发言等各种渠道的信息。传统的查找方式不仅费时费力,还容易遗漏关键内容。那么,有没有一种方式能让AI真正代替人工,完成从找资料到写出稿的全流程工作?
华中科技大学与马里兰大学研究团队开发出Sage评估框架,首次无需人工标注即可评估AI评判员可靠性。研究发现即使最先进的AI模型在评判任务中也存在严重不一致问题,近四分之一困难情况下无法保持稳定偏好。团队提出明确评判标准和专门微调等改进方法,为构建更可靠AI评估体系提供重要工具。