7 月 7 日 -10 日,以 “智联世界·众智成城” 为主题的2021世界人工智能大会(WAIC2021)在上海举办。华为云盘古超大规模预训练模型现已开放体验,观众在华为展区可通过多种交互方式感受盘古在中文语言处理方面的强大能力。

2021世界人工智能大会华为展区
华为云盘古大模型旨在建立一套通用、易用的人工智能开发工作流,以赋能更多的行业和开发者,实现人工智能工业化开发。通过与行业知识结合,盘古大模型能快速实现不同场景的适配,加速AI行业应用,让AI开发由作坊式转变为工业化开发的新模式。华为云盘古系列大模型包括中文语言(NLP)、视觉(CV)大模型,多模态大模型、科学计算大模型。

盘古大模型被评选为大会“镇馆之宝”
2021年4月,在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录。与CLUE评测标准一致,本次盘古大模型的展示包括成语填空、阅读理解、快速分类三项。盘古能应对中文中同词不同义的特殊情况,以 “明明明明明白白白喜欢他,但他就是不说”为例,“明明”既是一个人名又是一个形容词,断句复杂,但是盘古大模型能轻松回答“白白喜欢谁?”、“谁喜欢明明?”的问题。在快速分类的演示中可以看到,盘古大模型能对商品及服务的评价做出“正面”或“负面”的分类,即使不包含任何感情色彩的词语,例如“凌晨下单第二天就从几千公里来到了手里”,盘古大模型能给出“正面评价”的结论。
盘古NLP大模型具备广泛的运用场景,在金融领域,可以辅助识别企业风险,助力企业尽调和项目审核。在医疗方面,其强大的信息抽取能力,可以帮助科研人员和医生从海量文献中快速提取关键知识。
除了NLP外,华为云盘古系列大模型还包括30亿参数的全球最大视觉(CV)预训练模型。CV大模型在ImageNet 1%、10%数据集上的小样本分类精度上均达到目前业界最高水平(SOTA),ImageNet上线性分类评估首次达到了和全监督相比拟的结果,相关创新成果也被人工智能顶级学术会议CVPR 2021和ECCV 2020、ICCV 2019等收录。
盘古CV大模型在业界首次实现了模型的按需抽取,根据不同部署环境的运行要求可以自动抽取出的适合的模型,模型差异动态范围可达三个数量级。目前已经在医学影像、金融、工业质检等100余项实际任务中得到了验证,平均缩短开发时间 80% 以上,极大地提升了开发效率以及模型性能。
未来,华为云盘古预训练大模型将上线华为云AI资产共享社区(AI Gallery),提供多种使用方式,降低人工智能的使用门槛,服务更广大的开发者群体。
截止目前,华为云AI已在10+行业,600+项目成功落地,在本次世界人工智能大会上,华为云还将举办“以技术智变,创城市质变”分论坛,并重磅发布《AI赋能智慧城市白皮书》,敬请期待。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。