智能时代,AI技术正在发挥至关重要的作用,而开源的深度学习框架不仅能够降低AI开发者的门槛,而且能够极大节省成本与时间,成为创新的重要推手。2022年3月26-27日,昇思MindSpore TechDay活动线上成功举办,包含昇思MindSpore 1.6新版本发布、企业应用案例分享、AI大模型关键技术、AI+科学计算进展分享等精彩环节,帮助开发者更深入了解昇思MindSpore技术创新和社区治理。
华为昇腾计算业务副总裁田昆阳在致辞中表示华为开源昇思MindSpore已有两年,年轻且充满活力,底层支持的模型类型和数量非常丰富,能够支撑全场景AI应用。在取得丰硕科研成果的同时,形成了一个完善的生态,并与高校、知名学术科研机构以及产业伙伴紧密合作,共同构建繁荣的AI生态。
活动中,昇思MindSpore 1.6版本正式发布,新版本在易用性、开发效率、控制流性能等方面带来全新的升级:用户即时体验的开发套件MindSpore Dev ToolKit,一键环境管理,5分钟完成环境搭建;基于深度学习的智能代码补全,单模型开发键盘敲击次数可减少30%;开发全流程可视化,代码及对应的图结构及时查看,支撑集群训练性能问题的快速定位。
同时还展示了昇思MindSpore 原生AI大模型成果,通过AI编译器实现多维度混合并行,支持数据并行、数据切片预处理等七维混合并行算法,是并行维度业界最多、模型结构支持最全、单机容纳模型参数业界最强的AI框架,实现开发并行代码量降低80%、系统调整时间下降60%,单机完成千亿模型参数训练的超强能力。目前已训练出全球首个三模态大模型紫东.太初、全球首个遥感影像智能解译深度学习专用框架(武汉.LuojiaNet)以技术的领先性以及产业落地的巨大前景分别成立了“多模态人工智能产业联盟”和“智能遥感开源生态联盟”,开创了产业落地的新模式。
此外,在科学计算AI新赛道,昇思MindSpore通过架构创新,完成AI计算框架向AI融合框架的演进,通过神经网络模拟的非线性拟合,让科学家无需再解高维方程,提升科技创新效率,大幅度提高开发效率和科学计算性能。
昇思MindSpore以硬核技术特性推动科研创新,不仅学习资源丰富,成长路径完善,参与门槛低,是一个具备“全场景协同、全流程极简、自适应演进”三大技术优势的AI开源社区。截至2022年3月,昇思MindSpore社区下载量突破140万,社区贡献者超4000人,服务企业数量超5000家,与120多个科研院所展开合作,越来越多的AI开发者在昇思MindSpore社区找到了志同道合的朋友一起“改变世界”。
好文章,需要你的鼓励
ETH Zürich等机构研究人员提出TrustVLM框架,解决视觉-语言模型预测可信度问题。该方法利用模型中存在的"模态差距",创新性地结合图像到文本和图像到图像的相似度,实现无需重新训练即可大幅提升误分类检测性能。在17个数据集的严格测试中,TrustVLM相比现有方法在关键指标上提升显著,同时改善了零样本分类准确率。此成果为AI系统在自动驾驶、医疗等安全关键领域的可靠部署提供了重要保障。
这项研究提出了个性化安全概念,解决大语言模型对不同用户采用统一安全标准的问题。研究团队创建了PENGUIN基准测试集评估模型在处理高风险场景时的个性化安全能力,并开发了RAISE框架高效获取关键用户信息。实验表明,提供用户背景可使安全分数提高43.2%,而RAISE框架通过平均仅2.7次交互即可提高安全分数31.6%。这一创新方法将AI安全从"一刀切"转向"个性定制",为高风险领域的AI应用提供了新思路。
明尼苏达大学研究团队提出了一种创新方法,通过回合级信誉分配显著提升大语言模型(LLM)智能体的多回合推理能力。传统方法只对整个过程进行评价,而他们的MT-GRPO算法能够精确评估每个决策步骤的价值,就像为每一步提供具体反馈。在维基百科搜索工具使用场景中,该方法实现了100%的工具执行成功率和50%的答案精确匹配率,远超传统方法。这一突破不仅提高了AI在多步骤任务中的表现,也为开发更复杂的AI系统提供了重要思路。
这篇研究介绍了PISCES——一种能精确从大语言模型参数中移除特定概念知识的创新技术。与现有方法不同,PISCES通过解缠器模型识别概念相关特征,直接编辑模型参数,实现了更精准的知识移除。在Gemma和Llama模型上的测试表明,该方法不仅有效降低了目标概念的准确率(低至7.7%),还保持了模型在无关领域的高性能,并显著提高了对"重新学习"的抵抗力。这一突破为AI系统的安全部署和合规使用提供了新的可能性。