智源研究院：为AI研究和应用打好“数据关” 原创

作者：高玉娴

为推动行业数据开放共享，支撑人工智能基础研究与关键技术研发，北京智源人工智能研究院专门成立数据开放研究中心，旨在制定数据开放标准，研究数据开放核心技术，搭建数据开放共享平台。

一年前，北京智源人工智能研究院（以下简称“智源研究院”）在北京正式揭牌。作为落实“北京智源行动计划”的重要举措，智源研究院在科技部和北京市委市政府的指导和支持下，由北京市科委和海淀区政府推动成立，是依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研发机构。

一年后，由智源研究院主办的2019北京智源大会在国家会议中心举行。大会邀请了国际人工智能领域的顶级专家学者参加，围绕人工智能基础研究现状及面临的机遇和挑战、人工智能技术未来发展的核心方向等话题，回归AI技术本身，开展了深入研讨。

在开幕式上，智源研究院院长黄铁军介绍了智源研究院一年来的工作进展。他表示，截至今年10月底，研究院已遴选出智源学者69人。同时还建立了“北京智源-旷视智能模型设计与图像感知联合实验室”和“北京智源-京东跨媒体对话智能实验室”两大联合实验室，以推动数据、场景和技术开放。此外，通过建设人工智能行业数据集，智源研究院发布了全球最大的物体监测数据集和多轮自然对话数据集，并计划在未来3年建设15个数据集。

智源研究院院长黄铁军

与京东合作成立跨媒体对话智能实验室

其中，北京智源-京东跨媒体对话智能实验室在今年10月初正式成立，聚焦跨模态智能对话与人机交互领域，针对零售、物流、客服、金融、保险等应用场景，开展大规模跨模态信息感知、对话、用户画像及其应用的技术研究。

据数据开放研究中心主任唐杰介绍，早在半年前，智源研究院就开始与京东筹划联合实验室，经过双方反复的探讨、调整，最终将该实验室定位为以自然语言处理为中心的联合研发机构。基于此，联合实验室每年会定期发布一系列人机对话项目，包括人机对话数据集、人机对话平台、人机对话竞赛等等。同时，联合实验室还引入了大约四分之一到三分之一的城市计算相关数据，用以提升相关项目的计算能力。

依托京东在电商零售领域的海量数据积累和强大算力，联合实验室主要分为两类，一是与高校院所共建联合实验室，主要开展人工智能基础理论研究；二是与优势企业共建联合实验室，主要开展人工智能重大应用共性关键技术研究。

“接下来，我们还会与京东进一步合作开放以人机对话为中心的数据集，推动包括京东在内的企业和机构在人工智能应用方面的发展。”唐杰向记者介绍，“除此之外，我们还将基于这一平台去做更多的事情，比如推动人工智能人才的培养和发展。在这方面，我们每年会在暑假期间与京东合作举办人工智能暑期训练营，邀请资深专家对学生和相关学员进行培训。”

与此同时，联合实验室还将通过定期举办权威国际比赛等方式，吸纳更多全球顶尖团队和人才，来实验室开展联合研究与产业化服务。

成立数据开放研究中心，加快数据共享

为了在更广泛的层面上推动行业数据的开放和共享，支撑人工智能研究与关键技术研发，智源研究院还专门成立了数据开放研究中心，并在大会上正式揭牌。

数据开放研究中心正式揭牌

谈及成立数据开放研究中心的初衷，唐杰表示，首先，是为了支持更加广泛、更加容易、更加轻量级的数据共享，加快应用迭代；其次，是为了消除许多企业对于联合实验室方式中存在的行业内竞争的顾虑；其三，是为了保证数据共享过程中的隐私保护和数据安全。

“智源研究院最初成立时主要想做几件事，一是吸收智源学者，二是成立联合实验室，三是建立AI社区。”唐杰坦言，“但是在这个过程中，我们慢慢发现，由这种任务驱动的推进事实上很慢，以上三个方面都是比较重量级的工作。因此，数据开放研究中心的成立，将为智源研究院进一步推动人工智能极其应用发展提供巨大助力。”

值得一提的是，数据开放研究中心的进行数据共享的一大前提就是数据安全，在这方面，智源研究院还将与专业团队一起合作，围绕数据如何脱敏、如何加密、如何加入更多保护性措施进行更深的相关研究。

唐杰认为，一直以来，数据安全防护和相关技术研究实际上是一个“道高一尺，魔高一丈；魔高一尺，道高一丈”的过程，攻与防的技术正在持续交替发展。在“防”的层面，近两年来也有很多技术得到了发展和应用。比如，通过“联邦学习”的方式，可以对数据模型而不是具体数据进行开放和共享；再比如，通过“加密共享”的方式，可以对数据库中的数据进行加密，在可计算的前提下确保数据安全。

而谈及数据开放研究中心的数据开放标准，唐杰也表示，在现阶段，智源研究院会建立对应的开放数据社区，并将所有数据在社区基础上全部共享出去。下一步，研究院还将通过与智源学者的探讨，制定相关的共享机制，既保证开放，又保证安全。

来源：至顶网人工智能频道

0赞

好文章，需要你的鼓励

智源研究院：为AI研究和应用打好“数据关” 原创

来源：至顶网人工智能频道

2019

11/06

06:03

分享

点赞

联想问天 WR5220 G5服务器

联想问天 WA7880a G3服务器

苹果注重隐私的年龄验证方案可解决两大难题

Cursor通过收购Graphite继续扩张之路

ChatGPT新增个性化设置功能，用户可自定义聊天体验

Kuxiu S3固态电池充电宝替代多款充电器的全能解决方案

Waymo自动驾驶出租车遭遇交通灯故障停摆事件分析

智启未来，共筑开发者生态 AMD携手DataWhale、魔搭社区，共建ROCm开发者生态

千问C端事业群成立后首推平价AI眼镜：低至1999元，搭载千问AI助手

Aqara Hub M200为HomeKit带来Matter支持和新自动化选项

LG智能电视强制安装Copilot快捷方式引发用户不满

Palo Alto Networks与谷歌云签署数十亿美元AI合作协议

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: