十张图概览《中国AI指数报告》:中国重头戏是应用,算法和硬件要补课 原创

本周,《中国人工智能指数报告》在北京正式发布。该报告从学术、产业、开源软件包使用、公众认知及媒体关注等几个维度进行了中美对比,以此度量中国人工智能在近十几年里的发展现状及其影响。

本周,由长江商学院人工智能与制度研究中心主任许成钢教授和武汉大学大数据与云计算实验室主任崔晓晖教授团队共同研究撰写的《中国人工智能指数报告》在北京正式发布。

该报告从学术、产业、开源软件包使用、公众认知及媒体关注等几个维度进行了中美对比,以此度量中国人工智能在近十几年里的发展现状及其影响。其中,部分指数的构建沿用了斯坦福大学的人工智能指数(Aritificial intelligence index 2017 Annual Report)的构建方法。不同的是——第一,该报告侧重分析中国的情况,指数针对的是中国市场;第二,通过将美国作为技术前沿的基准进行对比,更好地展现中国的真实情况;第三,在学术部分根据影响力进行了等级划分。

据了解,该报告将每年发布一次。在本次发布会上,许成钢教授对报告的主要内容进行了介绍,并表示,在以人工智能和大数据为核心的第四次产业革命中,中国的企业将会面对过去从未经历过的挑战和机遇,包括革命性的技术变化、商业模式的变化,社会的变化,以及残酷的淘汰过程。而此次发布的《中国人工智能指数报告》,正是希望记录和反映这种变迁。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

长江商学院人工智能与制度研究中心主任许成钢教授

以下是报告的部分重要内容:

一、学术

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图1:中美人工智能期刊论文年度发表量对比

如图1所示,从1995年至今,中国在人工智能领域发表的研究论文数量整体少于美国,但是在2008年到2012年期间曾大幅超过美国,后又回落,直到近几年来曲线开始出现收敛。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图2:中美学者参加所有人工智能学术会议的总数

图2显示,从1996年至今,美国学者参加学术会议的人次始终明显高于中国,并且差距基本保持不变,没有明显的收敛趋势。
许成钢教授解释,统计这一维度数据的原因在于,人工智能领域的迅速发展,使得大量学者常常会把自己的短期研究成果首先会发表在学术会议上(甚至只发表在学术会议上),之后便投入到实践工作中。而学术会议的常规是,申请者的论文得到会议学术委员会或组织者接受,才获得参会资格。因此,参会人数通常可以视为会议论文发表的数量。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图3:中美人工智能期刊论文被引用总数

图3是中美学者每年在期刊发表的所有人工智能论文的被引用总数,其中,美国学者发表的期刊论文被引用数始终明显高于中国。但是在2010年之后,差距迅速下降,曲线呈收敛趋势。

许成钢教授表示,在学术领域,论文被引用往往意味着其影响力,因此这方面的数据统计可能比简单的论文发表数量更有参考价值。同时,他也指出,发表数量与影响力之间也并不是简单的对应关系,因为也有高质量的论文很少被引用的情况。

为了进一步将两国学者发表的论文质量进行对比,报告将论文的引用数量划分为了6个等级进行分析,分别是千级(引用量 1000 及以上),百千级(引用 量 500-999),百级(引用量 100-499),十级(引用量 10-99),个级(引用量 1-9)以及零 级(引用量 0)引用量文章。统计的次数是每篇论文截止 2018 年 10 月的总引用次数。

以千级和零级两个极端的级别为例:

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图4:中美千级期刊论文引用总数量对比分析

如图4所示,美国在千级期刊论文发表数量以及总引用量方面均高于中国。中国学者在 2004 年,2005 年和 2007 年各出现了一篇千级期刊论文, 而同一时期美 国学者发表了 12 篇千级引用量的期刊论文。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图5:中美零级期刊论文发表总数量对比分析

如图5所示,虽然没有被引用的论文数量多年以来两国差距都不是很明显,但是自2011年起,中国却开始大幅超过美国。

对于其中的原因,许成钢教授猜测,可能是由于这些论文讨论的是在比较狭窄的范畴中的应用问题,在超出一定范围后,对于别人就没有引用价值。此外,崔晓晖教授还补充道,中国高校学术生态的特殊性也可能是造成这一结果的原因之一。

二、人才

这部分的数据来源于领英的《全球AI领域人才报告》,其中,中国的AI人才总数为5万人,美国为83万人。(领英人才数据包括了国际上的教育、科研和企业各领域人才,所有参与国际学术或行业交流的人都在其中,但是不参与国际交流的人才有可能未被统计)。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图6:根据从业时间分为五个不同类别进行的中美AI人才分布对比

图6数据显示,美国的AI人才质量优于中国,尤其是通过比较从业年限超过十年的从业人员数量对比可知,美国拥有更多超过十年工作经验的AI人才,并且每个年限段的总数都超过中国。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图7:根据子领域划分对比的两国AI人才分布比例

图7显示,中美两国AI人才的重点发展领域基本一致,但中国的数量总体上比美国要少得多。在人才比例分布上,中国在智能营销和计算机视觉方面的人才比例超过美国,表现中国人工智能在应用方面的特点。另外, 中国在芯片方面的人才比例超过美国,可能反映了追赶硬件发展方面的人才培养和资源配置。值得注意的是,在算法和机器学习方面,美国不但人才的比例比中国大,人才总数也是中国在这方面领域的二十几倍,说明中美在人工智能软件上面的差距显著。

三、产业

在人工智能产业方面,国内已经有不少报告。许成钢教授特别提到了2017年腾讯发布的《中美两国人工智能产业发展全面解读》,并表示,此次报告的这部分内容是在其基础上进行的补充。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图8:中美人工智能领域创业公司数量对比

图8是风险投资支持的、中美在人工智能领域的活跃的创业公司总数的统计。如图所示,中国的人工智能创业公司在2012年之前多于美国,但是在2012年以后美国不仅超过中国,且大幅度加速增长。此外,而中国在2015年以后呈大幅下降趋势;相反,美国方面在2012年之后在人工智能领域活跃的创业公司数量呈现快速上升的趋势。人工智能产业需要长期研发投入,短期很难获得收益。中美两国活跃的创业公司的数量的对比,似乎表明中国在人工智能领域产业的投入后劲不足。

四、开源软件包使用

开源人工智能软件包是人工智能研究,尤其是人工智能应用研究方面的重要基础。报告对比了中美人工智能研究者在GitHub软件库中,关注(stare)不同 AI软件包的数字,以此作为使用开源AI软件包使用的指数。数据显示,中美人工智能研究者们关注Google TensorFlow软件包的数字远高于关注其他软件包。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图9:中美 AI 研究者的 AI 软件包关注总数对比

图9是中美 AI 研究者的 AI 软件包关注总数对比。如图所示,中国应用 AI 研究者关注开源AI 软件包的数字,在2015年之后经历了快速增长,到2017 年中以后,超过了美国。

许成钢教授表示,这可能意味着中国研究者在利用中美开发的开源软件包做 AI 应用研究规模超过了美国。

五、媒体报道

公众对人工智能的认知可能会影响人工智能在商业和社会中的应用,也可能会对相关监管以及立法带来很大的影响。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

图10:中国、全球(英语国家)人工智能文章正负比例

如图10所示,在2013 年中国关于人工智能的正负面报道差距不大。伴随着2014年之后人工智能的快速发展,中国对于人工智能的正面报道迅速超过负面报道。在2014年到2016 年之间,中国媒体对人工智能的正面报道比例在每月均在64%以上,大幅度超过负面报道。在2016年以后每月正面比例均超过82%,而正负比例相加总和均在90%左右,中性比例仅占10%左右。与此相比,英语国家媒体对人工智能的正面报道比例也超过负面报道,但是正面报导所占的比例最高只到 30%,而中性报道比例均在66%以上。也就是说,英语国家对于人工智能报道以中性为主。

总结:理性看待人工智能发展

总的来说,许成钢教授指出,如今人工智能正在以革命性的速度、广度、深度发展。对于中国来说,目前在深度学习应用方面的规模并不亚于美国,甚至在某些方面已经超越美国。然而,他也强调,这只是在应用层面。中国在人工智能的基本算法、芯片、传感器等方面仍然落后于多数发达国家,这些领域也将成为突破通用人工智能技术大门的钥匙,因此也是中国接下来应该去补上的课。

同时,他还介绍了人工智能框架与经济学之间的紧密关系。首先,最早的人工智能逻辑就是一个推理和寻找最优解的过程,而经济学的核心也是决策。从这方面来看,人工智能框架本身就是经济学模型。比如博弈论中非常重要的机制设计理论,现在已经被广泛应用到复杂的计算领域。“所有人工智能领域的课题,但凡有了决策,这个行为就是经济学范畴的内容。”许成钢教授说。

反过来说,如今人工智能也进一步在对整个经济学领域,包括社会科学领域产生着重要影响。因为经济学与社会科学的研究依据来自于数据,而人工智能将是数据获取、处理和分析的重要工具。

在这一阶段,人工智能将成为人类强大的辅助,在各个领域帮助人类解决各种问题,包括人脸识别、语音识别、智慧客服、大数据分析、智慧医疗等等。崔晓晖教授表示:“我认为人工智能更多是一种对于人类或者整个社会的赋能。它作为一种工具,可以帮助我们提高效率、建立美好的生活,甚至包括建立美好的环境,在各方面进行相应的赋能。”

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

武汉大学大数据与云计算实验室主任崔晓晖教授

拿产业赋能来说,天云大数据CEO雷涛分享了三个关键词——祛魅、重构和知识生产。他认为,在过去的很长一段时间里,人类知识的产生都来自于经验,由专家封装、移动知识。但随着经验形式的流程开始被数据和系统所替代,人类知识的生产方式开始进化到从机器、系统中产生。从这个角度而言,AI是知识再生产的一次规模性革命,是对很多行业专业知识的新的表达。所以,重构的过程是人工智能对于所有行业的很深远的商业流程和模式的影响。

对此,科技日报总编辑刘亚东却“泼了一把冷水”。他表示,“应该对人工智能有清醒的认识,如果用人的一生来比喻人工智能,现在人工智能可能还没满月。因为与人工智能相关的基础学科还没有大规模突破,我们不应该人云亦云。任何一个产业、一种产品,包括人工智能产业、产品,只有企业家最有资格、最有能力也最有意愿对它的发展前景做出判断,别人不能越俎代庖”。

十张图一览《中国人工智能指数报告》:中国的重头戏是应用,算法和硬件的课还要补上

“其实,只要你意愿往这个领域转移,人工智能真的会助力你,你如果拒绝它,真的是在损害你自己”。许成钢教授最后总结说。

来源:至顶网人工智能频道

0赞

好文章,需要你的鼓励

2019

03/22

18:03

分享

点赞

邮件订阅