近日,全球安全顶级会议ACM CCS以及顶刊IEEE TDSC发布获选论文名单,蚂蚁数科的两项隐私计算创新技术成果入选,标志着蚂蚁数科在隐私保护人工智能(Privacy-Preserving AI)技术领域的持续领先。这两项研究聚焦当前跨机构联合建模中应用最广泛的梯度提升决策树(GBDT)模型,通过创新的隐私保护算法,解决了联合建模和联合推理中如何在保障数据隐私前提下实现高性能计算的技术难题。
这两研究成果分别是被ACM CCS2025收录的《Gibbon: Faster Secure Two-party Training of Gradient Boosting Decision Tree》(长臂猿:更快的2方安全GBDT训练框架)与被IEEE TDSC录用的《Privacy-preserving Decision Graph Inference from Homomorphic Lookup Table》(基于同态查找表的隐私保护决策图推理)
GBDT类模型(包括XGBoost、LightGBM等)是一种基于梯度提升的决策树算法,可解释性强,预测速度快,广泛应用于营销、风控等场景,是跨机构联合建模中最流行最常用的算法。然而,在多方协作训练与推理过程中,如何在保障数据隐私的前提下实现高性能计算,长期面临“安全强则效率低,效率高则隐患多”的两难困境。
当前业界多采用联邦学习(FL)路线,虽性能较高,但存在潜在的信息泄露风险。例如,隐私计算联盟于2024年发布的《隐私计算产品通用安全分级白皮书》中就分析、披露了业内最流行的FL方案SecureBoost的信息泄露风险。
蚂蚁数科则另辟蹊径,选择安全等级更高但性能挑战更大的多方安全计算(MPC)技术路线,通过GBDT算法与先进密码学的深度协同设计,实现了安全与效率的双重突破:
目前,上述研究成果已应用于蚂蚁数科隐私计算系列产品中,全面支持跨机构间高安全、高性能、可落地的数据协作。
蚂蚁数科已构建覆盖多场景的隐私计算产品矩阵:包括面向数据基础设施的可信数据流通平台FAIR;服务于金融与营销场景的隐私计算解决方案摩斯(Morse);以轻量化中间件形式为AI、BI及业务系统提供嵌入式隐私计算能力的密态中间件;以及为大语言模型应用提供全方位的数据和模型隐私保护的大模型隐私保护产品。
ACM CCS是国际公认的信息安全领域旗舰会议,被中国计算机学会(CCF)列为CCF-A类会议。IEEE TDSC是由IEEE Computer Society出版的权威学术期刊,聚焦可信计算、安全计算等研究领域,也是中国计算机学会A类期刊,代表该领域的最高学术水平。
好文章,需要你的鼓励
当前世界充满变数,IT领域除AI外鲜少受到关注。从气候变化到地缘政治紧张局势,IT在公众讨论中边缘化。这在技术变革关键时刻十分危险。CEO、高管和媒体对IT缺乏深度思考,普遍持"不坏就别谈"的态度。CIO需要重新获得利益相关者关注,克服对IT运营的冷漠和无知。技术文盲问题严重,大多数人从未构建过IT系统。IT行业需要重新赢得人心,大幅提升公众IT知识水平。
OpenAI团队的最新研究揭示了大语言模型产生幻觉的根本原因:AI就像面临难题的学生,宁愿猜测也不愿承认无知。研究发现,即使训练数据完全正确,统计学原理也会导致AI产生错误信息。更重要的是,现有评估体系惩罚不确定性表达,鼓励AI进行猜测。研究提出了显式置信度目标等解决方案,通过改革评估标准让AI学会诚实地说"不知道",为构建更可信的AI系统指明方向。
技术驱动的变革比以往更加频繁,但成功并不能得到保证。Gartner研究显示,只有五分之一的组织能够在75%或更多时间内从转型项目中获得预期收益。其余都是昂贵的失败。有效的变革管理能够提高技术采用率,服务于业务目标。变革管理不再是边缘活动或软技能,而是决定新举措是否能够创造商业价值的核心绩效学科。
字节跳动AI实验室提出"逆向工程推理"新范式,通过从优质作品反推思考过程的方式训练AI进行创意写作。该方法创建了包含2万个思考轨迹的DeepWriting-20K数据集,训练的DeepWriter-8B模型在多项写作评测中媲美GPT-4o等顶级商业模型,为AI在开放性创意任务上的应用开辟了新道路。