“大模型的应用从‘上新品’逐渐进入‘强应用’阶段,更好的通用人工智能仍在路上。”10 月 29 日,蚂蚁数科CTO王维在香港金融科技周2024 分享时指出。
两年前,大语言模型(LLM)的出现,引发了全球科技从业者的普遍关注和行业热潮。ChatGPT 月活用户数以史上最快速度达到 1 亿,AI 行业迎来“ChatGPT时刻”。经过一段时间的狂奔,LLM性能阶段性趋于饱和,大模型底层推动力逐渐收敛到少数拥有核心数据及算力资源的公司,行业注意力也更多转到了以Agent为代表的行业应用侧。

如何解放 LLM 应用的局限性。王维强调,高质量的行业数据和专业工具是 AI 继续发展的关键壁垒和门槛,行业应用需要系统性地解决专业严谨和安全可信等问题。蚂蚁数科“蚁天鉴”产品,集大模型安全测评与防御为一体,让大模型在生产和使用过程中更安全、可控、可靠。
他认为,高质量数据可以更好地模拟客观世界,提升模型的准确性和稳定性。过去十年,伴随着AI发展的范式转移,对数据的要求也在持续改变。机器学习从“以模型为中心”转向“以数据为中心”。在当下的 LLM时代,行业应用要做到安全可信,其核心是如何结合专业人工+AI算法的高效标注,产生高质量的标注数据。
而面向未来的AGI时代,随着互联网公开数据逐步耗尽,以及GPT-o1带来的强化学习训练新范式,都预示着数据合成的重要性进一步提升。王维指出,如何通过仿真引擎、自博弈(self-play)强化学习的方式,合成出更多互联网所不覆盖的高质量、高价值领域数据,将是到达AGI时代的关键。

他也提醒道,AI 是把双刃剑,AIGC滥用所带来的风险需要系统性应对。不久前,“AI 教父” 杰弗里·辛顿(Geoffrey E. Hinton)在采访中再次强调了其对AI安全问题的强烈担忧。他与另外两位图灵奖得主约书亚·本吉奥(Yoshua Bengio)、姚期智及来自世界各地的几十位科学家共同签署了一封公开信——“AI 安全国际对话威尼斯共识”,呼吁为推动人工智能的发展制定更好的保障措施。
他们在公开信中警告道,“随着人工智能的快速发展,这些‘灾难性的结果’随时可能发生。”究其问题根源,在于 AIGC 的滥用不仅会产生虚假信息和网络钓鱼攻击,还可能引发全球性的诈骗活动。其中,值得关注的一大风险来源便是Deepfake, 即基于深度学习算法,从大量的视频和图像数据中学习,伪造出逼真的面部动画和语音。
王维介绍,蚂蚁数科旗下身份安全品牌 ZOLOZ 为此专门研发了综合防控产品 ZOLOZ Deeper,以应对在开户、登录、支付等各种场景的深度伪造风险。在服务印尼某头部银行后,产品上线一个月时间内实现了 Deepfake 风险“0 漏过”。
好文章,需要你的鼓励
"影子AI"是指员工在未经公司批准的情况下使用AI工具办公。虽然ChatGPT等工具能提升效率,但将内部文件、客户数据或源代码输入未授权平台,可能导致企业数据失控。IBM报告显示,20%的企业存在未授权AI工具,63%尚无AI治理政策。专家建议,一味封禁效果有限,企业应明确哪些工具可用、哪些数据禁止上传,员工也应主动核查AI输出内容,避免将敏感信息粘贴至公共AI平台。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
Hirebotics联合Fanuc发布首款基于无代码Beacon平台的防爆协作喷涂机器人Cobot Painter。该方案适用于金属制造商,无需专用喷涂房或复杂编程,可在现有人工喷涂环境中数日内完成部署。操作人员通过平板或手机的"点击示教"功能即可引导机器人完成路径学习,实现液体涂料、粉末涂装等高精度重复作业,帮助制造商将涂装业务收回自主管理。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。