2021北京智源大会很有“料”:发布全球最大智能模型,打造虚拟大学生,推动全方位生态合作

作者:高玉娴   【原创】   2021-06-03 19:06:30

关键字: 悟道 微软小冰 智源研究院 人工智能

从2019年成立以来,智源研究院从学术研究出发,不仅在技术层面不断创新,并且,正在持续加速产业应用落地和生态构建,如今,已经成为中国人工智能产业发展和应用的核心“赋能者”。

2021年6月1日-3日,第三届北京智源大会在北京线下和线上同步举行。这场由智源研究院主办的年度国际性人工智能高端学术交流活动,定位于“AI内行顶级盛会”,旨在打造北京乃至中国人工智能发展的“学术名片”。

今年,大会除了4场全体大会之外,还设置了29个分论坛,安排了近200场顶尖报告;嘉宾阵容方面,更是邀请到了Yoshua Bengio、David Patterson两位图灵奖得主,以及国内外超过200多位人工智能领域的顶尖专家。会议期间,超过3万多名人工智能领域专业人士注册参会。

全球最大智能模型“悟道2.0”亮相

在大会开幕式上,智源研究院院长黄铁军教授从创新研究、学术生态、产业发展与AI治理四个方面介绍了智源研究院在过去一年的工作规划和建设进展。2021北京智源大会很有“料”:发布全球最大智能模型,打造虚拟大学生,推动全方位生态合作智源研究院院长 黄铁军教授

其中,在创新研究方面,智源研究院确定了将打造智能模型作为源头创新的核心任务,在组织架构、资源保障和机制体制上进行了系统部署,全力构建“悟道”信息模型、“天演”生命模型和“天道”物理模型。

黄铁军指出,这“智能三剑客”底层共同的需求是算力,“在强大的智算体系支持下,三大模型性能将快速提升,共同支撑新一代人工智能模型的建立,进而赋智各行各业,赋智万物。”“但是,我们认为,真正能赋智各行各业的超大模型将来在全世界范围内都是屈指可数的,所以应该尽快把资源收敛到少数超大规模智能模型上。”

正是意识到这一点,智源研究院很快就明确了目标并快速行动,从去年10月份开始启动超大规模智能模型研发工作,并在今年3月20日率先发布了我国首个超大规模智能模型“悟道1.0”,训练出了中文、多模态、认知、蛋白质预测等系列模型。而仅仅经过了2个多月的时间,“悟道2.0”又在本次大会上重磅发布,实现了跨越式的更新。

智源研究院理事长张宏江在会上强调,目前,“大模型+大算力”是迈向通用人工智能等一条可行路径,在他看来,大模型对于人工智能的价值相当于“发电厂”在电力时代的意义。“未来,我们将基于大模型形成类似于电网的变革性AI产业基础设施,将数据转换为智能能力,驱动各种AI应用。如果将大模型和所有的AI应用相连接,为用户提供统一的智能能力,全社会将形成一个智能能力生产和使用的网络,即‘智网’。” 张宏江表示。

2021北京智源大会很有“料”:发布全球最大智能模型,打造虚拟大学生,推动全方位生态合作

智源研究院理事长 张宏江

从目前来看,“悟道”是为各行各业提供智能化能力的基础智能模型,是当前及未来一段时间人工智能全面赋智经济社会发展的中心任务。所以,它毋庸置疑也是智源研究院眼下核心的工作之一。

为此,在“悟道”的研发过程中,智源研究院还颠覆性地改变了过去小团队的模式,建立了有目标的大团队,用系统的方法,以问题为导向探索最好的解决方案。“我们把全国的AI研发力量都整合到了一起,形成了一个‘兵团进剿’的模式,然后把算力也集中整合到一起。”张宏江强调。

从“1”到“2”的跨越式突破

具体来说,悟道团队由智源研究院学术副院长唐杰教授领衔,100多位来自清华、北大、人大、中科院等的科研骨干共同参与,短短一年多的时间,实现了从0到1,又从1到2的层层突破。唐杰表示,“悟道”的目标是对标世界领先水平,旨在打造数据和知识双轮驱动的认知智能,能够让机器像人一样思考。虽然,现在只是2.0版本,但“悟道”已经是一个非常“全能”的选手,在问答、绘画、作诗、视频、配文案、菜谱等很多任务中都正在逼近图灵测试的机器认知能力。而它的目标,是超越这一基准。2021北京智源大会很有“料”:发布全球最大智能模型,打造虚拟大学生,推动全方位生态合作智源研究院学术副院长 唐杰教授

相较于1.0版本,此次发布的“悟道2.0”进一步做到了“大而聪明”,具备大规模、高精度、高效率三大支点——唐杰将这描述为“你是(实)最大”。

2021北京智源大会很有“料”:发布全球最大智能模型,打造虚拟大学生,推动全方位生态合作

首先,“大”指的是模型参数规模之大。据唐杰介绍,“悟道2.0”的参数规模达到了1.75万亿,是OpenAI在去年5月发布的超大规模语言模型GPT-3的10倍,打破了之前由Google Switch Transformer预训练模型创造的1.6万亿参数记录,也是目前中国首个、全球最大的万亿级模型,首次在100%的国产超算上训练了万亿模型;

其二,“最”指的是精准度之最。“悟道2.0”在世界公认的9项Benchmark基准测试任务上取得优异成绩,在图形处理、文本任务等方面都达到了精准智能。比如,ImageNet zero-shot SOTA在200类超过了OpenAI CLIP,LAMA知识探测超过了AutoPrompt, LAMBADA完形填空能力超过1.7倍参数微软Turing NLG;

2021北京智源大会很有“料”:发布全球最大智能模型,打造虚拟大学生,推动全方位生态合作

其三,“实”指的是框架的实用性。过去,大规模预训练模型的参数规模通常远超传统的专用人工智能模型,在算力资源、训练时间等方面消耗巨大。而为了提升大规模预训练模型的产业普适性和易用性,悟道团队搭建高效预训练框架,在高效编码、高效模型、高效训练、高效微调和高效推理等方面进行全链路的原创突破或迭代优化,实现效率的大幅提升;

最后,“你”指的是“邀你参与”。唐杰表示,目前“悟道”框架中已经整合了大量数据,建设了全球最大的语料数据库WuDaoCorpora2.0,包含全球最大的中文文本数据集、全球最大的多模态数据集、全球最大的对话数据集,为行业内大规模智能模型的研发提供了丰富的数据支撑,并提出了自然语言评测新标准“智源指数”。在此之上,悟道团队希望更多的人参与进来,贡献数据、分享数据,做更大的数据集,通过更大的算力,做出更优美的模型。

在应用场景中扎实落地

除了技术层面的跨越式突破,“悟道”也在行业应用中迈出了扎实步伐。比如,通过与新华社合作,将大模型应用于新闻内容处理、图文生成、传播优化,从而助力中国新闻事业的数字化转型。

此外,更令人期待的,是智源研究院与智谱AI和微软小冰公司合作,共同打造的虚拟大学生“华智冰”。这一虚拟数字人师从唐杰教授,以“悟道”为内核,依托小冰框架,在进入清华学习后,将持续提升在音乐、绘画及诗歌等领域的创作能力,以及基于情感的交互能力,包括为清华创作毕业季主打歌等等。

“我们希望她在多项认知智能上能够超过人,不仅仅是识别图像,更多的应该有创造能力,比如作诗、绘画,甚至是回答一些数学问题或者编程。”唐杰在接受记者采访时对“华智冰”提出了自己的期待,“比如让她做一个网页,她就能自动设计出网页的板块,还能把里面的代码填满,让代码正常运行。”

在这个过程中,悟道将为“华智冰”提供万亿级别的模型训练,而小冰的人工智能框架将让她拥有人一样的对话能力、交互能力和情感能力。“通过把悟道和小冰框架结合起来,加上智谱知识和数据的双轮驱动,我们希望未来‘华智冰’将拥有更多的认知和推理能力,而不是简单的检索。”唐杰强调。

据他介绍,像“华智冰”这样的虚拟数字人目前在很多场景都可以应用。比如:面向冬奥会,智源研究院为电视台提供了手语播报的虚拟数字人,从而帮助听障人士更便利地观看冬奥会赛事,同时减轻电视台的手语播报压力;另外,在北京各类场馆,还有用于科普的机器人,也是数字人形象;在情感陪伴领域,智谱AI团队还与学堂在线合作,通过数字人与学员进行交互,提升学员的在线时长和专注力。

从学术研究出发持续扩大生态

当然,要让人工智能的应用范围更广、程度更深,一方面,需要持续的学术性研究,另一方面,也需要尽可能多的角色加入进来。针对前者,智源研究院将持续实施“智源学者计划”,并成立面向海内外AI青年科研人员开展学术交流的“青源会”,从而打造活跃的人工智能和技术创新生态;针对后者,智源研究院还推动开展了“悟道”超大规模智能模型产业生态建设,将面向个人开发者、中小创新企业、行业应用企业、IT领军企业等不同主体,分别提供模型开源、API调用、“专业版”大模型开发、大模型开发许可授权等多种形态的模型能力服务,赋能AI技术研发。

在本次大会上,智源研究院与新华社、美团、小米、快手、搜狗、360、、寒武纪、第四范式、好未来、智谱华章等22家“悟道”大模型产业生态战略合作企业进行了签约,签约企业涵盖行业应用企业、IT龙头企业、中小创新企业等。同时发出组建“悟道”大模型技术创新生态联盟的倡议,吸引更多企业加入,将以联盟为枢纽,以企业需求为导向推动模型研发,共同开发基于“悟道”大模型的智能应用,以模型研发和应用促进产业集聚。

另外,智源研究院还启动了“悟道之巅”模型应用大赛,鼓励各类创新机构及技术人员基于“悟道”大模型开发新颖实用的智能应用,赋智更行业发展,同时不断发掘和培育基于超大规模智能模型的创新企业,推动本市人工智能产业可持续发展。

针对行业,智源研究院锁定智能医疗,特别成立了“健康医疗研究中心”,构建医疗大数据和高质量小数据等基础数据,从而加快人工智能在健康医疗领域的深度应用。

同时,为推动AI原创成果转化落地,智源研究院还在去年启动建设了创新中心,目前已经建立了智能信息处理、认知知识图谱、安全人工智能等多个创新中心。而今年,智源研究院还将按照国家和北京市促进科技成果转化的最新部署,积极整合技术、场景、人才、资金等资源,推出支持AI创业的“源创计划”,为AI创业团队开放大模型、数据集等生态资源,为来自学术界的AI科学家创业团队对接应用场景,为来自产业界的创业团队对接业界领先的AI技术,加快形成可落地应用的AI产品。另外,还将通过设立创业基金等方式,加快孵化一批具有国际领先技术能力的AI创新企业,为北京AI产业的持续发展储备力量。

总的来说,从2019年成立以来,智源研究院从学术研究出发,不仅在技术层面不断创新,并且,正在持续加速产业应用落地和生态构建,如今,已经成为中国人工智能产业发展和应用的核心“赋能者”。

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:010-62641205-5060 举报邮箱:jubao@zhiding.cn 安全联盟认证