全球首个AI智能体安全测试标准发布，蚂蚁集团、清华大学、中国电信等联合编制

世界数字科学院（WDTA）在联合国日内瓦总部正式发布AI STR系列新标准《AI智能体运行安全测试标准》。

日前，世界数字科学院（WDTA）在联合国日内瓦总部正式发布AI STR系列新标准《AI智能体运行安全测试标准》，标准由蚂蚁集团、清华大学、中国电信牵头，联合普华永道、新加坡南洋理工大学、美国圣路易斯华盛顿大学等二十余家国内外机构、企业及高校共同编制，为全球首个单智能体运行安全测试标准。

该标准针对智能体跨越“语言墙”所带来的“行为”风险，首次将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境对应起来，构建了全链路风险分析框架；同时，细分了智能体风险类型，完善并创新提出了模型检测、网络通信分析和工具模糊测试等测试方法，弥补了智能体安全测试技术标准的空白。

标准在AI for Good全球峰会期间由联合国社会发展研究所（UNRISD）与世界数字科学院（WDTA）联合主办的“数字技术与人工智能社会影响全球咨询会”上发布。

2025年，被称为“智能体元年”。AI智能体凭借着深度思考、自主规划、做出决策并深度执行的能力，使得AI在发展路径上实现一次范式突变：从“我说AI答”到“我说AI做”，并被逐渐应用到各类商业场景中。

然而，技术突破伴随着不容忽视的安全隐忧。最新调研显示，超过70%的智能体从业者担忧AI幻觉与错误决策、数据泄露等问题，因为AI生成的内容往往包含事实错误，或者对指令产生误解，其中超半数受访者表示，所在企业尚未设立明确的智能体安全负责人。

“面对AI相关技术的快速演进，我们必须正视‘科林格里奇困境’：一旦新技术深植社会，风险治理的代价将成倍上升。”WDTA执行理事长李雨航强调，“AI STR系列标准正是试图在这一临界点前建立清晰、可执行的安全标准和测评、认证体系，将伦理与责任嵌入AI的全生命周期之中，从而确保技术发展服务于人类的长期利益。”

全球首个AI智能体安全测试标准发布，蚂蚁集团、清华大学、中国电信等联合编制

峰会上，蚂蚁集团大模型数据安全总监杨小芳表示，当前AI技术应用加速落地，但单智能体的安全风险缺乏统一的全链路安全测试标准，导致潜在的等问题难以被量化和规避，单智能体标准的制定是AI治理的“最小可行单元”，而多智能体治理是未来“摩天大楼”的核心结构，下一步行业应从单点逐步向多智能体治理生态共建突破。

与其他国际标准不同，AI STR不仅关注风险识别和风险分级，更提供全流程管理方案，即从数据治理到模型落地，配套具体测试工具和认证流程，助力企业提升AI应用的安全性与可信度。

该标准不仅提供了一套可行可靠的智能体安全基准，也为全球AI智能体生态的安全、可信和可持续发展增加了有益的探索。目前，部分标准的测评与认证已在金融、医疗等领域落地应用。

此前，WDTA已发布3项AI STR标准，包括“生成式人工智能应用安全测试标准”,“大语言模型安全测试方法”和“大模型供应链安全要求”，由 OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同参与。

来源：至顶网人工智能频道

蚂蚁

0赞

好文章，需要你的鼓励

全球首个AI智能体安全测试标准发布，蚂蚁集团、清华大学、中国电信等联合编制

来源：至顶网人工智能频道

2025

07/14

16:10

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

2025 Inclusion·外滩大会科技智能创新赛“AI安全”赛事启动选手招募

蚂蚁国际联合国际掉期与衍生工具协会ISDA在新加坡发布跨境支付通证化行业框架

瞄准AGI等四大前沿领域，蚂蚁集团2025“蚂蚁InTech奖”提名启动

蚂蚁数科加速推进AI战略，设立“AI+产业创新”实验室

首个RWA 上链技术规范立项 “Antchain inside”成行业标准

蚂蚁数科提出创新跨域微调框架ScaleOT入选全球AI顶会AAAI 2025

蚂蚁集团AI推动服务业智能化实践入选社科院《智能经济蓝皮书》

蚂蚁数科的RWA，是香港金融的下一步？

蚂蚁数科余滨：以AI全面升级云产品 加速迈向AI原生时代

OceanBase杨冰：现代数据架构需要具备可扩展性、多模融合等五大特性

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

蚂蚁数科余滨：以AI全面升级云产品加速迈向AI原生时代