11月8日,在2025年世界互联网大会·乌镇峰会前沿人工智能模型论坛上,蚂蚁集团平台技术事业群总裁骆骥发表了主题演讲,分享了蚂蚁持续通过技术创新实现大模型突破的实践和思考。
骆骥指出,近年来通用人工智能(AGI)在“规模定律”(Scaling Law)推动下快速发展,部分能力已达到并超越人类基准。主流旗舰级语言大模型的训练数据量已超过20T,参数规模已迈入“万亿”时代,同时算力资源的紧张与成本的上升,成为制约AGI在“规模定律”下继续突破的关键因素。

在这样的背景下,蚂蚁集团探索了一系列技术创新来实现智能体验的突破,包括通过模型参数效率、数据应用效率、计算效率“三大效率”的优化,撬动智能体验的“两大关键要素”——模型的响应速度与模型的知识规模,希望以此推动AGI普惠应用。
骆骥以蚂蚁百灵大模型为例,介绍了这些技术创新的实效。过去一段时间,蚂蚁百灵已构建了涵盖语言、推理、多模态等全尺寸、全模态、全面开源的大模型体系。其中,10月发布的全球首个开源的万亿思考大模型Ring-1T,展现了领先的逻辑推理、代码能力,数学能力达到了国际数学奥林匹克竞赛银牌水平,医疗健康、创意写作方面也表现强劲,其背后通过创新训练方法,稳定了训练与推理的双端长度,将训练效率提升了近一倍。
值得一提的是,蚂蚁在控制推理生成的Token数量方面亦取得了重要突破,Ling-1T采用演进式思维链,在保障思考正确率的同时显著降低token资源消耗,实现了任务效果与计算成本之间的“帕累托最优”。在算力方面,蚂蚁已部署万卡规模的国产算力集群,适配自研与各主流开源模型,训练任务稳定性超过98%,训练与推理性能可媲美国际算力集群,并全面应用于安全风控领域的大模型训练与推理服务。
骆骥强调:“理想的未来并不是AI取代人,而是AI助力人类放大能力,实现人机高度融合与协作。在人与AI共生的时代,我们不仅要不断提升智能化水平,更要确保AI技术遵循伦理与安全可信。”
目前,蚂蚁百灵大模型的技术已落地多个领域,尤其在医疗健康方面取得突破。蚂蚁今年推出的首个AGI原生医疗应用AQ,服务了近8亿医保码用户, 链接了5000家医院, 推动了普惠医疗智能化的发展。
作为蚂蚁集团的重要技术成果,百灵大模型以“双万亿”规模参数、前沿架构创新及国产算力深度应用,展现了中国力量在AGI研发领域的竞争力。世界互联网大会·乌镇峰会不仅是全球互联网创新交流的重要平台,也见证了中国企业在人工智能技术与应用普惠化上的坚实步伐。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。