据澳大利亚联邦银行(Commonwealth Bank)数据科学主管Dan Jermyn说,联邦银行利用人工智能(AI)帮助客户的日常沟通,客户参与度提高了400%。
联邦银行创建了名为客户参与引擎(CEE)的人工智能“旗舰实现”。 CEE是个帮助“协调客户体验”的“中心化决策平台”。
Jermyn周五在悉尼大学举行的首届道德数据科学会议上表示,“我们希望确保我们与他们谈的是正确的一项。这是非常困难的,”。
联邦银行拥有几百万客户,客户可能希望在几十种不同的渠道上谈论几千种不同问题里的某一个问题。
Jermyn表示,“你可以想象一下我们有多少关乎客户的信息,所有的金融交易信息,所有的互动信息等等。”
他还表示,“只要我们可以解码这些信息,那么就可以在任何时间点上找到与客户交谈的最佳方式的答案。”
CEE目前内置在19个通信渠道内,可分析2000亿个数据点,给出 “数千种组合”里下一个要谈的最佳点,可以在“几分之一秒”内做出决定。
在有些情况下,这些信息是提供给客户服务代理用的。
Jermyn 表示,“然后人类接手,接手的东西包括所有那些我们无法用机器复制的技能,社会同理心、那些面对具体一个人时对特殊情况的理解以及什么对他来说是重要的什么不重要、他的情绪状态是什么等的判断等等。“
他表示,“我们真正做的是为我们人类腾出更多时间来做那些真正重要的事情、做人类真正擅长的事情,目的是让每个人都受益。”
他还表示,“可以说,CEE指出了行业中人工智能该做的事情的最佳实施方向。”
在其他的一些情况下,CEE可用于 “智能警报”。
Jermyn给出了联邦银行日常沟通的一个例子,是个智能手机的通知,内容为,“提醒:您的个人贷款还款将在7天后到期。请不要忘记过数以免交付额外滞纳金。”
Jermyn 表示,“我们看到的最大差异高达400%,这时我们开始思考我们该如何决定提出来、对谁提出来、何时以及在什么情况下提出来。”
联邦银行还利用人工智能帮助分析客户对财务状况的认识。
Jermyn 表示,“一个组织里人工智能的道德实施的第二个阶段不仅仅是做你认为是正确的事情。而是要知道你正在做的事情是正确的,是可以适当度量的。”
联邦银行基于现有的研究做了人们对财务福祉的认识方面的工作。联邦银行利用对客户的金融交易和其他指标的了解发现,现实比人们的看法更极端。
一方面,9%的人表示他们的财务状况有问题,但根据联邦银行的一些指标该数据达18%。另一方面,12%的客户表示他们的财务状况很好,但联邦银行认为实际上有15%的客户的财务状况很好。
我们可能会觉得,对财务状况看法影响最大驱动因素是工资和收入。但联邦银行发现,影响客户看法的因素最多的是行为模式,包括支出和储蓄模式以及他们如何管理自己的资金。
Jermyn 表示,“行为模式是这一块的全部。”
Jermyn 还表示,“对我们来言,人工智能最令人兴奋的一个方面就是人工智能实际上可以令我们为我们的客户获取更好的结果。”
他表示,“若无人工智能,我们就无法做到这一点。根本不可能的。”
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。