英国保诚集团目前正在加大对人工智能(AI)的投入,目标是简化内部流程、提升员工能力、提升客户互动体验等等。

位于新加坡的保诚人工智能实验室是该项工作的核心。该实验室是与谷歌云公司的一项合作计划,为保诚的15000名员工提供了一个贡献创意和试验人工智能应用的平台。保诚首席信息官兼实验室负责人Tomasz Kurczyk表示,“这个人工智能实验室是一个推动创新的载体。我们正在利用来自亚洲和非洲的全部24个市场的见解、知识和专业技能。”
他表示,这样做将使保诚能够识别和推广旗下的整个网络中成功的人工智能应用,即使那些可能缺乏资源独立开发这些能力的 “边缘市场”也能从中受益。
该实验室是一个整合创意的中心枢纽,提供必要的数据、平台功能和人才,将创意转化为实际应用。Kurczyk表示,“我们采取的是一种分批次的方法,选择那些对客户影响、差异化和业务效益潜力最大的用例。”
保诚的人工智能战略聚焦三个关键领域:医疗保健、金融知识和咨询以及提升客户体验。涵盖使用案例十分广泛,包括改进承保和理赔流程、为财务代表提供培训及客户沟通的支持等等。
保诚还在测试人工智能代理的应用,目前正在进行一项试点计划,利用人工智能代理提供礼宾服务,例如预约安排。除前端应用外,保诚也希望改造后台功能,包括受严格法规和控制约束的精算科学。
Kurczyk表示,“精算师一直都是最初的数据科学家。但与其去针对这些仍然高度敏感的核心精算工作进行自动化,不如利用人工智能去简化一些辅助流程,例如数据发现和分析,使精算师能够更高效地工作。这不一定是自动化,而是赋能。”
有些保诚的人工智能用例可能看起来与其他金融机构的举措类似,但Kurczyk表示,保诚的重点是创造可衡量的价值。他表示,就此而言,保诚人工智能计划的成功与否取决于具体的指标,例如衡量客户体验的净推荐值的提升、效率的改进和合规状况的改善。
保诚认识到有效利用人工智能是未来的一项关键技能,因此正在投资一些技能提升计划。
这些计划是针对一些具体部门的需求而量身定制的,重点是增强员工利用人工智能工具提高工作效率的能力,并在提示词工程和特定领域应用等方面获得专业知识。
Kurczyk表示,“我们坚信这对我们的员工有好处。”他指出,即使是些微的效率提升也能为员工腾出时间,去从事更有价值的工作。
保诚人工智能战略的一个关键要素是负责任地使用人工智能。Kurczyk表示,“我们拥有一个完善的人工智能解决方案治理框架,坚持 FEAT(公平、道德、问责和透明)原则,并运用了技术风险管理。”他补充表示,该框架涵盖了整个人工智能生命周期,从开发和部署到持续监控模型漂移和偏差。
此外,保诚采用了严格的测试和并行运行方法,尤其是在理赔处理等领域,这使得保诚能够确保其人工智能模型的准确性,并可以应对不断变化的市场条件。Kurczyk表示,“并行运行将持续数月,在我们非常确信能够达到我们为自己设定的严格基准之前,该解决方案将不会部署到生产环境中。”
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。