2023年7月6日,昇腾人工智能产业高峰论坛在上海举办。论坛现场,华为联合四家伙伴共同发布昇腾AI大模型训推一体化解决方案,加速大模型在各行业里快速落地应用。

随着深度学习领域的快速发展,越来越多的应用场景需要使用大模型来进行训练和推理。然而,企业在大模型开发全流程中,常常面临切换硬件集群、适配底层硬件以及微调优化等复杂问题。加之大模型研发周期长、部署门槛高等系列挑战,“攒机”式开发手段难以满足需求。
为有效解决以上问题,华为联合四家伙伴共同发布昇腾AI大模型训推一体化解决方案,实现了训推一体,提供了“开箱即用”的解决方案,同一个集群内可以无缝切换大模型的训练和推理过程,从而为客户提供高效的大模型训练和推理部署流程;同时,解决方案内置了大模型推理引擎、调优工具和算子加速库,支撑客户开箱即用,无需进行二次硬件适配,即可让客户能够直接使用大型预训练模型,从而降低了技术门槛;结合昇腾AI基础软硬件能力和伙伴模型和平台优势,通过嵌入四家伙伴各自在大模型训练、微调和优化方面的算法和模型能力,共同设计、联合开发、协同上市、持续迭代,实现为客户提供更全面的解决方案,更能满足全场景、全行业客户使用。
昇腾AI大模型训推一体化解决方案重塑了大模型开发流程,让大模型在行业充分发挥价值,帮助客户更好地应用大型深度学习模型。未来,华为也将继续携手合作伙伴,共同推动大模型与行业的深度融合与应用落地,为更多行业提供高效的解决方案,加速全场景、全行业应用成果落地。
好文章,需要你的鼓励
联想推出全新数据存储产品和服务,旨在满足企业AI应用日益增长的需求。新产品包括ThinkAgile FX系列、ThinkSystem DS存储阵列等,提供开放灵活的硬件软件配置。研究显示63%的企业尚未为AI功能做好准备,联想通过混合云服务、数据生命周期管理等解决方案,帮助客户实现基础设施现代化,降低实施风险并提升投资回报率。
北京大学团队开发的DragMesh系统通过简单拖拽操作实现3D物体的物理真实交互。该系统采用分工合作架构,结合语义理解、几何预测和动画生成三个模块,在保证运动精度的同时将计算开销降至现有方法的五分之一。系统支持实时交互,无需重新训练即可处理新物体,为虚拟现实和游戏开发提供了高效解决方案。
英伟达宣布收购开源工作负载管理系统Slurm的主要开发商SchedMD,该系统专为高性能计算和AI设计。同时发布Nemotron 3系列开源AI模型,包括面向特定任务的Nano、多智能体应用的Super和复杂任务的Ultra三个版本。英伟达CEO黄仁勋表示,开放创新是AI进步的基础,将通过透明高效的开放平台帮助开发者构建大规模智能体系统。
达尔豪斯大学研究团队系统性批判了当前AI多智能体模拟的静态框架局限,提出以"动态场景演化、智能体-环境共同演化、生成式智能体架构"为核心的开放式模拟范式。该研究突破传统任务导向模式,强调AI智能体应具备自主探索、社会学习和环境重塑能力,为政策制定、教育创新和社会治理提供前所未有的模拟工具。