11月25日,由国家数据局主办的“数据要素×”大赛落幕。蚂蚁数科凭借“数据锻造工厂”——高知识密度稀缺数据锻造解决方案荣获国赛优秀奖(商业价值奖)及省级金奖。
“数据要素×”大赛是由国家数据局联合中央网信办、工业和信息化部等20多个部委及机构共同主办的全国性赛事,全国共计超2.2万个参赛项目,设置工业制造、现代农业、金融服务等13个行业赛道及开放性创新赛道,聚焦数据要素融合应用。当前,大模型的训练与优化高度依赖高质量数据,其中高知识密度、可验证的稀缺数据供给尤为不足,成为行业共性难题。

蚂蚁数科此次参赛的“数据锻造工厂”解决方案,核心依托形式化技术实现高质量数据的合成、生产与验证。该方案可将人类顶级专家的可验证经验转化为大模型训练数据,实现大模型泛化能力与专家经验严谨性的结合,针对性解决AGI时代高质量数据稀缺问题。
作为蚂蚁集团旗下科技商业化板块,技术落地与价值转化是蚂蚁数科的核心方向。目前,“数据锻造工厂”已在江苏太仓数据标注基地投入应用,旨在通过跨行业人才与前沿技术,为长三角制造业、金融、医疗等领域的大模型落地提供场景化、高质量的训练数据支撑。
记者获悉,蚂蚁数科团队已孵化出IMO奥赛题形式化转写数据集,正与国内某头部模型厂商合作,在通用大模型及数学模型测试中持续优化方案。
蚂蚁数科相关负责人表示,未来将继续围绕数据要素领域,坚持技术创新与业务落地并重,探索高质量数据在AI发展中的更多应用场景。
好文章,需要你的鼓励
阿里云CEO吴泳铭在财报电话会议上表示,AI需求增长如此迅猛,以至于服务器部署速度无法跟上客户需求。公司正在对GPU进行配给制,优先满足使用全套阿里云服务的客户需求。过去12个月,阿里巴巴在AI相关基础设施上投入1200亿元人民币,预计三年预算可能超过当前的3800亿元。阿里云智能集团季度营收达56亿美元,同比增长34%。
这项由中国人民大学联合腾讯开发的LaSeR技术,发现了AI在生成答案最后一刻会无意中透露对答案质量的评估。通过观察这个"最后一词效应",研究人员开发出了一种让AI高效进行自我评估的方法,在几乎不增加计算成本的情况下,大幅提升了AI的自我验证能力,为构建更可信的AI系统开辟了新路径。
OpenAI为ChatGPT推出"购物研究"新功能,恰逢假期购物季。该功能面向免费和付费用户开放,支持移动端和网页版。用户询问购物问题时,ChatGPT会提供个性化购物助手服务,通过一系列问题帮助用户筛选价格、用途和功能偏好。该功能基于专为购物任务优化的GPT-5 mini版本,从优质网络资源获取产品信息。OpenAI计划推出即时结账功能,允许用户直接在ChatGPT内购买商品。
新加坡南洋理工大学团队开发的NEO模型颠覆了传统视觉语言AI的设计思路,从模块化拼接转向原生统一架构。仅用3.9亿图文配对数据就实现了与大型模块化系统相媲美的性能,证明了端到端训练的有效性,为AI系统设计开辟了新路径。