一年前,北京智源人工智能研究院(以下简称“智源研究院”)在北京正式揭牌。作为落实“北京智源行动计划”的重要举措,智源研究院在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区政府推动成立,是依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研发机构。
一年后,由智源研究院主办的2019北京智源大会在国家会议中心举行。大会邀请了国际人工智能领域的顶级专家学者参加,围绕人工智能基础研究现状及面临的机遇和挑战、人工智能技术未来发展的核心方向等话题,回归AI技术本身,开展了深入研讨。
在开幕式上,智源研究院院长黄铁军介绍了智源研究院一年来的工作进展。他表示,截至今年10月底,研究院已遴选出智源学者69人。同时还建立了“北京智源-旷视智能模型设计与图像感知联合实验室”和“北京智源-京东跨媒体对话智能实验室”两大联合实验室,以推动数据、场景和技术开放。此外,通过建设人工智能行业数据集,智源研究院发布了全球最大的物体监测数据集和多轮自然对话数据集,并计划在未来3年建设15个数据集。
智源研究院院长黄铁军
与京东合作成立跨媒体对话智能实验室
其中,北京智源-京东跨媒体对话智能实验室在今年10月初正式成立,聚焦跨模态智能对话与人机交互领域,针对零售、物流、客服、金融、保险等应用场景,开展大规模跨模态信息感知、对话、用户画像及其应用的技术研究。
据数据开放研究中心主任唐杰介绍,早在半年前,智源研究院就开始与京东筹划联合实验室,经过双方反复的探讨、调整,最终将该实验室定位为以自然语言处理为中心的联合研发机构。基于此,联合实验室每年会定期发布一系列人机对话项目,包括人机对话数据集、人机对话平台、人机对话竞赛等等。同时,联合实验室还引入了大约四分之一到三分之一的城市计算相关数据,用以提升相关项目的计算能力。
依托京东在电商零售领域的海量数据积累和强大算力,联合实验室主要分为两类,一是与高校院所共建联合实验室,主要开展人工智能基础理论研究;二是与优势企业共建联合实验室,主要开展人工智能重大应用共性关键技术研究。
“接下来,我们还会与京东进一步合作开放以人机对话为中心的数据集,推动包括京东在内的企业和机构在人工智能应用方面的发展。”唐杰向记者介绍,“除此之外,我们还将基于这一平台去做更多的事情,比如推动人工智能人才的培养和发展。在这方面,我们每年会在暑假期间与京东合作举办人工智能暑期训练营,邀请资深专家对学生和相关学员进行培训。”
与此同时,联合实验室还将通过定期举办权威国际比赛等方式,吸纳更多全球顶尖团队和人才,来实验室开展联合研究与产业化服务。
成立数据开放研究中心,加快数据共享
为了在更广泛的层面上推动行业数据的开放和共享,支撑人工智能研究与关键技术研发,智源研究院还专门成立了数据开放研究中心,并在大会上正式揭牌。
数据开放研究中心正式揭牌
谈及成立数据开放研究中心的初衷,唐杰表示,首先,是为了支持更加广泛、更加容易、更加轻量级的数据共享,加快应用迭代;其次,是为了消除许多企业对于联合实验室方式中存在的行业内竞争的顾虑;其三,是为了保证数据共享过程中的隐私保护和数据安全。
“智源研究院最初成立时主要想做几件事,一是吸收智源学者,二是成立联合实验室,三是建立AI社区。”唐杰坦言,“但是在这个过程中,我们慢慢发现,由这种任务驱动的推进事实上很慢,以上三个方面都是比较重量级的工作。因此,数据开放研究中心的成立,将为智源研究院进一步推动人工智能极其应用发展提供巨大助力。”
值得一提的是,数据开放研究中心的进行数据共享的一大前提就是数据安全,在这方面,智源研究院还将与专业团队一起合作,围绕数据如何脱敏、如何加密、如何加入更多保护性措施进行更深的相关研究。
唐杰认为,一直以来,数据安全防护和相关技术研究实际上是一个“道高一尺,魔高一丈;魔高一尺,道高一丈”的过程,攻与防的技术正在持续交替发展。在“防”的层面,近两年来也有很多技术得到了发展和应用。比如,通过“联邦学习”的方式,可以对数据模型而不是具体数据进行开放和共享;再比如,通过“加密共享”的方式,可以对数据库中的数据进行加密,在可计算的前提下确保数据安全。
而谈及数据开放研究中心的数据开放标准,唐杰也表示,在现阶段,智源研究院会建立对应的开放数据社区,并将所有数据在社区基础上全部共享出去。下一步,研究院还将通过与智源学者的探讨,制定相关的共享机制,既保证开放,又保证安全。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。