引言:华为中国生态大会2021“昇腾万里 共赢智能新时代”峰会盛大举行,峰会集聚人工智能产业界权威专家、学者和商业领袖,共商人工智能产业发展趋势,共同推动人工智能产业繁荣发展。华为昇腾计算业务总裁许映童发表《昇腾新生态 共赢新时代》主题演讲。
华为昇腾计算业务总裁许映童发表主题演讲
尊敬的各位来宾,下午好!欢迎大家今天来到华为中国生态大会2021昇腾人工智能峰会的现场。
我们一直说人工智能处于爆发式增长的前夜,如果用一句话总结过去一年的发展,那就是:人工智能快速增长,算法和模型不断取得新的突破,而人工智能与产业的结合,方兴未艾,我们已经看到智能时代的第一缕曙光。今天我们齐聚一堂,期待大家思想碰撞,共建AI新生态,共赢人工智能新时代。
得益于广大合作伙伴的支持,过去一年昇腾的生态快速发展,现在已经认证了超过200家合作伙伴,发展了超过30万开发者,其中核心开发者超过2000名,在100多所高校开展了昇腾的人工智能课程,已经初步构建了一个健康的可持续发展的生态。
在产业的发展上,我们也始终围绕人工智能计算中心以及八大重点行业开展工作,也取得了明显的进展。以武汉为代表的人工智能计算中心,我们也开启了“一中心四平台”新模式。鹏城云脑II实现上线即满负荷运作,三个打榜获得世界第一。
我们跟合作伙伴一起,推动了人工智能在产业的加速落地,在金融、能源、交通、医疗、教育等行业陆续落地,人工智能的价值初步得到了各个行业的认可,尤其是通过人工智能来加强社会转型升级的理念,深入人心。
过去一年我们一直在思考什么叫生态型产业、生态型产业和传统的产业究竟又何不同。今天我们总结了“一平台双驱动”。
“一平台”是指昇腾的基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、MindSpore 全场景AI计算框架,包括去年发布的应用使能平台MindX。这就构建了人工智能的“黑土地”。
平台要支撑两个生态,第一个是AI的技术生态,这里面包括了科研机构、高校、企业、合作伙伴的研究和开发人员。如果说AI的技术平台是一个工具,那我们技术生态就是优化和使用工具的人,如果没有一个健康繁荣的技术生态,人工智能的产业就将寸步难行。
第二个是商业生态,包括ISV、IHV、整机、一体机合作伙伴等,使用工具来开发人工智能产品,解决客户问题,最终来实现商业的闭环。
技术生态赋能产业生态,产业生态又牵引了技术的进步。而技术生态和产业生态共同驱动了人工智能产业的发展。
首先我们看如何构建技术生态。我们认为只有和全球最优秀的人、最优秀的组织合作,集众人之智,才能够实现弯道超车。我们希望从三个方面进行加强技术生态:
第一,基础的构建。集产业之智,集所有生态伙伴的力量打造一个“极简易用,极致性能”的基础软件平台。我们今年启动的昇腾“众智”计划,目前已经和全球55所高校,超过140个团队进行合作,累计投入超过1亿人民币。预计今年年底将完成超过1000个算子,700个模型,以及30多个面向行业的参考设计,而所有的成果将会在昇腾社区发布。
第二,科研创新,我们携手领先的研究机构、高校和企业建立一种新型的研发关系,加强前沿研究,探索AI应用的极限和边界,以科研增强底座肥力。首先,投入大模型的研究。我们相信一个领域通用的大模型取代无数个专用的小模型,是一个未来的发展方向,包括自然语言处理、CV大模型等。我们将和全球的顶尖机构合作,包括鹏城实验室、中科院自动化所等,而这些成果将赋能产业。其次,我们把AI引入科学计算领域,开展前沿应用研究。我们和武汉大学遥感学院以及深圳气象局都开展了研究合作,以昇腾AI支持遥感图像分析和短临天气预报。
第三,人才发展,包括高校人才、学生培养、企业人才发展,以产业汇聚人才,同时相信人才也会牵引产业不断进步。人才是技术生态最核心的组成部分,发展人才为AI产业提供源源不断的动力,是我们的核心理念。
技术生态只是水,而商业生态的成功才是我们的“诗和远方”。商业生态能否成功也取决于我们商业合作伙伴能否快速推出满足客户需求的解决方案,实现商业闭环。
去年,我们经过一年多的摸索,发现“为什么人工智能在产业落地这么困难”的原因之所在。我们提出了三大鸿沟:第一,算法实现难。真正能够从最底层开发面向应用算法的很难;第二,开发应用难;第三,规模部署难。
去年我们集中精力打造了分层解耦的昇腾基础软件平台,获得很多专业开发者的认可。今年我们会强化大颗粒度的技术解决方案,最核心的是帮助行业开发者跨越三大鸿沟。而技术解决方案在行业落地,由生态伙伴完成,形成面向千行百业的场景化解决方案。
今天我也非常荣幸发布五大技术解决方案:AI计算中心基础平台、AI数据中心训练、AI数据中心推理,AI异常检测、AI区域感知。
最后,除了我们在产品和解决方案上来支持合作伙伴,今年我们也推出了一个完整的商业支持计划。
去年我们发布了“昇腾万里合作计划1.0”,也得到了广大合作伙伴的积极反馈,今年我们也根据实际运营情况充分吸收了大家的意见,重磅推出“昇腾万里合作计划2.0”。
本次发布有两个方面的升级:
因聚而生,创新不止。昇腾计算产业是我们一个共同的产业。自从发布以来,也得到了大家的呵护和支持。今天我们也正式的发布昇腾产业的品牌和标识Powered by Ascend,这个标识和品牌是技术先进性和领先性的代名词,我们也希望在这个品牌的加持下,昇腾计算产业可以走得更高,走得更远。
我们也期待,待到山花烂漫时,昇腾万里笑颜开。
谢谢大家!
好文章,需要你的鼓励
P1.AI创始人保罗·埃雷门科正用合成数据训练AI设计物理系统,从住宅冷却到星际飞船,突破工程AGI的终极瓶颈——数据稀缺。他的AI工程师Archie已能像人类一样处理多物理场任务,目标是让机器设计人类无法想象的复杂系统。
波士顿大学研究团队开发的DORI基准测试从四个维度评估多模态大语言模型的物体方向理解能力:正面对齐、旋转变换、相对方向和规范方向感知。研究评估了15个最先进模型,发现即使最佳模型在粗粒度任务上的准确率也仅为54.2%,在细粒度方向判断上更低至33.0%,与人类表现相差近30%。结果表明当前模型在精确角度估计、多视角追踪和理解复合旋转方面存在系统性缺陷,反映了它们内部3D空间表示的根本局限,为未来模型设计提供了明确方向。
这篇研究介绍了Oracle AI团队开发的一种针对企业系统的域特定检索硬负样本挖掘框架。该方法通过整合多种嵌入模型、降维处理和独特的语义选择标准,动态识别具有挑战性但上下文无关的文档作为训练样本,显著提升了重排序模型的性能。在云服务领域的测试中,该方法在MRR@3和MRR@10指标上分别提升了15%和19%,并在多个公开领域数据集上展示了广泛适用性,为企业搜索和检索增强生成应用提供了实用解决方案。
Oracle研究团队开发了FS-DAG,这是一种用于视觉丰富文档理解的少样本领域适应图网络模型。与传统大型模型不同,FS-DAG仅需5份示例文档即可适应新文档类型,参数量不到90M,却在信息提取任务中表现卓越。模型采用模块化架构,结合预训练的文本和视觉特征提取器与图神经网络,展现出对OCR错误的极强鲁棒性(性能下降不到1%)。实验表明,FS-DAG在多种文档类型上优于LayoutLMv2等大型模型,同时具有更短的训练和推理时间。目前已被50多家企业采用,每月处理超过100万次API调用,证明了其在实际业务场景中的价值。