3月17日,中国工商银行发布基于昇腾AI的金融行业通用模型,首家实现了企业级金融通用模型的研制投产,并广泛应用于客服、营销、运营、风控等业务主战场中,推动人工智能技术在金融领域规模化应用的跨越式发展。
作为国有第一大行,中国工商银行始终践行大行责任,持续深化产、学、研、用的生态联动,率先引入昇腾AI基础软硬件平台,实现了基于千亿级基础模型的行业通用模型研制突破。
此次,AI大模型深入金融业务,必将掀起金融行业三大变革:
第一,发展根基立起来,金融行业关乎国计民生,昇腾AI基础软硬件平台,为金融自主创新保驾护航、打牢智能根基;
第二,客户体验提起来,金融个性化需求千变万化,金融行业通用模型,基于EB级高质量金融专属数据,人人都能享受高级VIP个性化服务;
第三,创新轮组转起来,金融科技创新永不止步,银行业务进入自动生成时代,全面提升智能+金融产品能力,助力银行快速推出金融创新服务。
基于昇腾AI训练的金融行业通用模型生成图制作而成的海报
人工智能已进入“大模型时代”。为了更好支持大模型发展,昇腾AI与产业界一起构建了从规划、开发到产业化的大模型全流程使能体系。
针对大模型的规划,在科技部的牵头下,中国科学技术信息研究所正在和产业界共同规划大模型地图,有序牵引中国大模型创新发展方向;在大模型开发方面,推出了大模型开发使能平台,让大模型更易开发、易适配、易部署;在推理部署阶段,通过大模型部署套件,在精度基本无损的情况下,实现模型十倍级压缩比,来支持大模型轻量化部署。
此次与中国工商银行的合作,是昇腾AI大模型全流程使能体系在金融领域的一次成功尝试。
从技术维度上讲,昇腾AI为行业通用模型训练提供了强大的算力保障,助力中国工商银行基于同业领先的开放式架构云计算平台,首家建设了异构高性能AI计算硬件、高带宽通信网络及异构计算框架,落成同业规模最大的千卡级算力集群。
从应用维度上讲,昇腾AI助力简化大模型从开发到部署的全流程,有效突破了人工智能在规模化应用方面通常具有的成本高、周期长、迭代慢等挑战。基于大模型的通用和泛化能力,典型智能场景的平均模型开发周期从一个月左右缩短到一周左右,极大的提升了业务需求的响应速度,节约了建模成本。
目前,工商银行金融行业通用模型已被创新应用于客户服务、风险防控、运营管理等多个业务领域,取得了良好的应用效果。在客户服务领域,工商银行应用该模型支撑智能客服接听客户来电,显著提升了对客户来电诉求和情绪的识别准确率,能够更精准有效地响应客户需求,并且可以大幅缩减维护成本。
在风险防控领域,工商银行实现了对工业工程融资项目建设的进度监测,监测精准度提升约10%,研发周期缩短约60%。在运营管理领域,模型的应用帮助智能提取期限、利率等信贷审批书核心要素,提升了信贷审批效率。
未来,昇腾AI将持续支撑中国工商银行发展前沿技术创新应用,不断提升金融行业通用模型的规模化赋能能力,助力数字中国、数字经济、数字社会规划和建设的高质量发展,奋力开创金融服务中国式现代化新局面。
*文章中引用数据来自中国工商银行公众号
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。