2023年6月9-11日,2023全球人工智能技术大会(GAITC 2023)在杭州召开,由中国人工智能学会、杭州市人民政府主办,华为技术有限公司承办,浙江杭州未来科技城(海创园)管委会执行的AI框架赋能大模型&科学智能原生创新专题论坛顺利举行。
6月10日上午,在大会主论坛上举行了中国人工智能学会-昇思MindSpore学术基金优秀项目颁奖仪式。国务院参事,中国工程院院士,清华大学信息科学技术学院院长、教授,北京信息科学与技术国家研究中心主任,CAAI理事长,CAAI/CAA Fellow 戴琼海和华为科学家咨询委员会主任徐文伟为获奖老师颁奖。
中国人工智能学会-昇思MindSpore学术基金优秀项目颁奖仪式
同日下午,戴琼海院士为AI框架赋能大模型&科学智能原生创新专题论坛致辞。他表示,“中国人工智能学会-昇思MindSpore学术奖励基金优秀项目奖”将成为学界与企业界连接的桥梁,推动昇思在AI领域科研的应用,激发原创性科学研究,夯实“国产AI框架的根基”。
戴琼海院士为论坛致辞
华为科学家咨询委员会主任徐文伟同为论坛致辞。他表示,华为将坚定践行开放、开源的策略,以共建、共享、共治为原则,持续贡献昇思MindSpore开源社区,把昇思打造成我国大模型和科学智能等AI创新的首选框架。
徐文伟为论坛致辞
CAAI元宇宙技术专委会主任、清华大学教授、国家杰青获得者陶建华和华为昇思MindSpore业务总经理、分布式并行计算实验室主任丁诚担任论坛主席。
陶建华教授主持会议
丁诚主持会议
在陶建华教授和丁诚的主持下,AI框架领域的专家们带来精彩纷呈的主题报告分享,引来现场阵阵掌声。
华为软件领域科学家,昇思MindSpore技术总经理,AI4Sci Lab主任于璠
发表《昇思MindSpore2.0最新技术竞争力与使能AI开发实践》主题报告
CAAI组织工委会副主任,北京航空航天大学教授,国家杰青获得者李建欣
发表《开放序列大数据的智能计算》的主题报告
中国科学院空天信息创新研究院研究员,IET Fellow 孙显
发表《多模态遥感智能解译基础模型技术与应用》的主题报告
香港科技大学广州信息枢纽院长、讲座教授,IEEE Fellow 陈雷
发表《Counterfactual Explanations in Explainable AI》的主题报告
中国人民大学高瓴人工智能学院长聘副教授孙浩
发表《面向复杂动力系统高效仿真的物理编码深度学习》主题报告
AI框架赋能大模型&科学智能原生创新专题论坛的圆满举行,进一步加深了AI领域学术成果的交流与联系,助力产学融合,探索新思路。未来,昇思MindSpore将积极与产业、学术等各界伙伴携手,夯实人工智能根技术,推动智能科技协同创新和融合发展。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。