智源研究院:为AI研究和应用打好“数据关”

作者:高玉娴   【原创】   2019-11-06 06:03:51

关键字: 京东 智源研究院 数据共享 人工智能

为推动行业数据开放共享,支撑人工智能基础研究与关键技术研发,北京智源人工智能研究院专门成立数据开放研究中心,旨在制定数据开放标准,研究数据开放核心技术,搭建数据开放共享平台。

一年前,北京智源人工智能研究院(以下简称“智源研究院”)在北京正式揭牌。作为落实“北京智源行动计划”的重要举措,智源研究院在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区政府推动成立,是依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研发机构。

一年后,由智源研究院主办的2019北京智源大会在国家会议中心举行。大会邀请了国际人工智能领域的顶级专家学者参加,围绕人工智能基础研究现状及面临的机遇和挑战、人工智能技术未来发展的核心方向等话题,回归AI技术本身,开展了深入研讨。

在开幕式上,智源研究院院长黄铁军介绍了智源研究院一年来的工作进展。他表示,截至今年10月底,研究院已遴选出智源学者69人。同时还建立了“北京智源-旷视智能模型设计与图像感知联合实验室”和“北京智源-京东跨媒体对话智能实验室”两大联合实验室,以推动数据、场景和技术开放。此外,通过建设人工智能行业数据集,智源研究院发布了全球最大的物体监测数据集和多轮自然对话数据集,并计划在未来3年建设15个数据集。

智源研究院:为AI研究和应用打好“数据关”

智源研究院院长黄铁军

与京东合作成立跨媒体对话智能实验室

其中,北京智源-京东跨媒体对话智能实验室在今年10月初正式成立,聚焦跨模态智能对话与人机交互领域,针对零售、物流、客服、金融、保险等应用场景,开展大规模跨模态信息感知、对话、用户画像及其应用的技术研究。

据数据开放研究中心主任唐杰介绍,早在半年前,智源研究院就开始与京东筹划联合实验室,经过双方反复的探讨、调整,最终将该实验室定位为以自然语言处理为中心的联合研发机构。基于此,联合实验室每年会定期发布一系列人机对话项目,包括人机对话数据集、人机对话平台、人机对话竞赛等等。同时,联合实验室还引入了大约四分之一到三分之一的城市计算相关数据,用以提升相关项目的计算能力。

依托京东在电商零售领域的海量数据积累和强大算力,联合实验室主要分为两类,一是与高校院所共建联合实验室,主要开展人工智能基础理论研究;二是与优势企业共建联合实验室,主要开展人工智能重大应用共性关键技术研究。

“接下来,我们还会与京东进一步合作开放以人机对话为中心的数据集,推动包括京东在内的企业和机构在人工智能应用方面的发展。”唐杰向记者介绍,“除此之外,我们还将基于这一平台去做更多的事情,比如推动人工智能人才的培养和发展。在这方面,我们每年会在暑假期间与京东合作举办人工智能暑期训练营,邀请资深专家对学生和相关学员进行培训。”

与此同时,联合实验室还将通过定期举办权威国际比赛等方式,吸纳更多全球顶尖团队和人才,来实验室开展联合研究与产业化服务。

成立数据开放研究中心,加快数据共享

为了在更广泛的层面上推动行业数据的开放和共享,支撑人工智能研究与关键技术研发,智源研究院还专门成立了数据开放研究中心,并在大会上正式揭牌。

智源研究院:为AI研究和应用打好“数据关”

数据开放研究中心正式揭牌

谈及成立数据开放研究中心的初衷,唐杰表示,首先,是为了支持更加广泛、更加容易、更加轻量级的数据共享,加快应用迭代;其次,是为了消除许多企业对于联合实验室方式中存在的行业内竞争的顾虑;其三,是为了保证数据共享过程中的隐私保护和数据安全。

“智源研究院最初成立时主要想做几件事,一是吸收智源学者,二是成立联合实验室,三是建立AI社区。”唐杰坦言,“但是在这个过程中,我们慢慢发现,由这种任务驱动的推进事实上很慢,以上三个方面都是比较重量级的工作。因此,数据开放研究中心的成立,将为智源研究院进一步推动人工智能极其应用发展提供巨大助力。”

值得一提的是,数据开放研究中心的进行数据共享的一大前提就是数据安全,在这方面,智源研究院还将与专业团队一起合作,围绕数据如何脱敏、如何加密、如何加入更多保护性措施进行更深的相关研究。

唐杰认为,一直以来,数据安全防护和相关技术研究实际上是一个“道高一尺,魔高一丈;魔高一尺,道高一丈”的过程,攻与防的技术正在持续交替发展。在“防”的层面,近两年来也有很多技术得到了发展和应用。比如,通过“联邦学习”的方式,可以对数据模型而不是具体数据进行开放和共享;再比如,通过“加密共享”的方式,可以对数据库中的数据进行加密,在可计算的前提下确保数据安全。

而谈及数据开放研究中心的数据开放标准,唐杰也表示,在现阶段,智源研究院会建立对应的开放数据社区,并将所有数据在社区基础上全部共享出去。下一步,研究院还将通过与智源学者的探讨,制定相关的共享机制,既保证开放,又保证安全。

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:010-62641205-5060 举报email:jubao@zhiding.cn 安全联盟认证