智能时代,AI技术正在发挥至关重要的作用,而开源的深度学习框架不仅能够降低AI开发者的门槛,而且能够极大节省成本与时间,成为创新的重要推手。2022年3月26-27日,昇思MindSpore TechDay活动线上成功举办,包含昇思MindSpore 1.6新版本发布、企业应用案例分享、AI大模型关键技术、AI+科学计算进展分享等精彩环节,帮助开发者更深入了解昇思MindSpore技术创新和社区治理。
华为昇腾计算业务副总裁田昆阳在致辞中表示华为开源昇思MindSpore已有两年,年轻且充满活力,底层支持的模型类型和数量非常丰富,能够支撑全场景AI应用。在取得丰硕科研成果的同时,形成了一个完善的生态,并与高校、知名学术科研机构以及产业伙伴紧密合作,共同构建繁荣的AI生态。
活动中,昇思MindSpore 1.6版本正式发布,新版本在易用性、开发效率、控制流性能等方面带来全新的升级:用户即时体验的开发套件MindSpore Dev ToolKit,一键环境管理,5分钟完成环境搭建;基于深度学习的智能代码补全,单模型开发键盘敲击次数可减少30%;开发全流程可视化,代码及对应的图结构及时查看,支撑集群训练性能问题的快速定位。
同时还展示了昇思MindSpore 原生AI大模型成果,通过AI编译器实现多维度混合并行,支持数据并行、数据切片预处理等七维混合并行算法,是并行维度业界最多、模型结构支持最全、单机容纳模型参数业界最强的AI框架,实现开发并行代码量降低80%、系统调整时间下降60%,单机完成千亿模型参数训练的超强能力。目前已训练出全球首个三模态大模型紫东.太初、全球首个遥感影像智能解译深度学习专用框架(武汉.LuojiaNet)以技术的领先性以及产业落地的巨大前景分别成立了“多模态人工智能产业联盟”和“智能遥感开源生态联盟”,开创了产业落地的新模式。
此外,在科学计算AI新赛道,昇思MindSpore通过架构创新,完成AI计算框架向AI融合框架的演进,通过神经网络模拟的非线性拟合,让科学家无需再解高维方程,提升科技创新效率,大幅度提高开发效率和科学计算性能。
昇思MindSpore以硬核技术特性推动科研创新,不仅学习资源丰富,成长路径完善,参与门槛低,是一个具备“全场景协同、全流程极简、自适应演进”三大技术优势的AI开源社区。截至2022年3月,昇思MindSpore社区下载量突破140万,社区贡献者超4000人,服务企业数量超5000家,与120多个科研院所展开合作,越来越多的AI开发者在昇思MindSpore社区找到了志同道合的朋友一起“改变世界”。
好文章,需要你的鼓励
VMware宣布将终止现有渠道合作伙伴计划,新计划采用邀请制,大幅减少授权合作伙伴数量。未受邀合作伙伴将于2025年7月15日收到不续约通知,可继续交易至10月31日。白标计划也将同时终止。此举是18个月内VMware第二次重大合作伙伴调整,旨在专注与少数核心云服务提供商深度合作。客户可能面临续约困难、服务质量下降和成本上升等影响。
StepFun公司推出的Step1X-Edit是首个能够媲美GPT-4o和Gemini2 Flash等商业模型的开源图像编辑AI。该模型通过整合多模态语言理解和扩散图像生成技术,能够处理11种编辑任务,在新构建的GEdit-Bench基准测试中表现优异,为图像编辑技术的民主化开辟了新道路。
谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。这种行为对多轮对话AI系统构成威胁,最新信息可能对LLM推理产生不成比例的影响。
BluOrion公司开发的ZClip是一种智能梯度裁剪算法,解决了大型语言模型训练中的梯度爆炸和损失飙升问题。通过Z分数统计检测和动态调整策略,ZClip能够自适应地控制梯度幅度,相比传统固定阈值方法提升训练效率35%以上,同时显著降低训练失败风险,为大模型训练提供了更稳定、高效的解决方案。