11月25日,由国家数据局主办的“数据要素×”大赛落幕。蚂蚁数科凭借“数据锻造工厂”——高知识密度稀缺数据锻造解决方案荣获国赛优秀奖(商业价值奖)及省级金奖。
“数据要素×”大赛是由国家数据局联合中央网信办、工业和信息化部等20多个部委及机构共同主办的全国性赛事,全国共计超2.2万个参赛项目,设置工业制造、现代农业、金融服务等13个行业赛道及开放性创新赛道,聚焦数据要素融合应用。当前,大模型的训练与优化高度依赖高质量数据,其中高知识密度、可验证的稀缺数据供给尤为不足,成为行业共性难题。

蚂蚁数科此次参赛的“数据锻造工厂”解决方案,核心依托形式化技术实现高质量数据的合成、生产与验证。该方案可将人类顶级专家的可验证经验转化为大模型训练数据,实现大模型泛化能力与专家经验严谨性的结合,针对性解决AGI时代高质量数据稀缺问题。
作为蚂蚁集团旗下科技商业化板块,技术落地与价值转化是蚂蚁数科的核心方向。目前,“数据锻造工厂”已在江苏太仓数据标注基地投入应用,旨在通过跨行业人才与前沿技术,为长三角制造业、金融、医疗等领域的大模型落地提供场景化、高质量的训练数据支撑。
记者获悉,蚂蚁数科团队已孵化出IMO奥赛题形式化转写数据集,正与国内某头部模型厂商合作,在通用大模型及数学模型测试中持续优化方案。
蚂蚁数科相关负责人表示,未来将继续围绕数据要素领域,坚持技术创新与业务落地并重,探索高质量数据在AI发展中的更多应用场景。
好文章,需要你的鼓励
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
本文提出一种评估人工智能风险的新方法,借鉴生态学与演化论视角,从理论生态模型中推导出三项风险指标,涵盖种群模型与生态系统模型。研究旨在为AI治理策略提供量化工具,并对分析局限性及政策改进方向进行了深入探讨,为构建更科学的AI风险评估体系提供参考框架。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。