上周刚刚闭幕的世界人工智能大会WAIC2023(7月6日-7月8日)与华为开发者大会 2023(Cloud)(7月7日-7月9日)期间,昇思MindSpore AI框架助力孵化的30+大模型、12+AI4S创新成果,分别在重磅发布仪式、展览展示等环节亮相。
在原生支持大模型领域,基于昇思MindSpore孵化、支持的重磅大模型超过30个,包括华为云盘古大模型3.0、中科院自动化所紫东太初2.0全模态大模型、面壁智能CPM-Bee、智谱AI CodeGeex大模型、云从科技从容大模型等领先成果,部分大模型已经在金融、制造等行业发挥重要价值。
在科学智能领域,昇思MindSpore打造了AI+科学计算套件,使能中国AI4S科研创新,已联合伙伴打造12+AI4S创新成果。昇思MindSpore通过打造流体仿真、电磁仿真、分子模拟等丰富科学智能套件,在提升系统性能基础上,屏蔽跨领域带来的开发难度,极大加速科研创新速度,并在流体仿真、天线阵列仿真等场景实现落地应用。
其中以华为云盘古大模型3.0为代表的成果,充分利用昇思MindSpore AI框架的自动并行、计算图内存复用、重计算、MindSpore Transformers套件等能力,提高大模型训练效率与精度,推动大模型在金融、制造、医药研发、煤矿、铁路等行业场景落地并发挥重要价值。7月6号国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》(《Accurate medium-range global weather forecasting with 3D neural networks》)。数据显示,这是近年来中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文。《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”
在7月6日下午举办的昇腾人工智能产业高峰论坛上,中国科学技术信息研究所首次发布《中国AI for Science创新地图研究报告》,报告中对科学智能(AI for Science)发展趋势、全球研究重点方向、国内发展现状及下一阶段发展建议提供详尽的介绍。目前,昇思已在多个科研领域展现指数级性能提升效果。基于昇思MindSpore AI框架打造的三维超临界机翼流体仿真大模型“东方.翼风”荣获WAIC2023最高奖SAIL奖。东方.翼风利用昇思MindSpore Flow流体仿真套件,结合流体领域专家经验和数据,实现对大飞机翼型全场景飞行工况模拟,大飞机三维翼型设计速度提升1000倍,并构建AI+通用气动仿真的泛化能力,加速气动领域国计民生行业跃迁式创新。
未来,昇思MindSpore AI框架将持续致力于打造人工智能创新之源,使能大模型与科学智能,成为AI创新的首选框架。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。