2023年7月6日,昇腾人工智能产业高峰论坛在上海举办。论坛现场,华为联合四家伙伴共同发布昇腾AI大模型训推一体化解决方案,加速大模型在各行业里快速落地应用。

随着深度学习领域的快速发展,越来越多的应用场景需要使用大模型来进行训练和推理。然而,企业在大模型开发全流程中,常常面临切换硬件集群、适配底层硬件以及微调优化等复杂问题。加之大模型研发周期长、部署门槛高等系列挑战,“攒机”式开发手段难以满足需求。
为有效解决以上问题,华为联合四家伙伴共同发布昇腾AI大模型训推一体化解决方案,实现了训推一体,提供了“开箱即用”的解决方案,同一个集群内可以无缝切换大模型的训练和推理过程,从而为客户提供高效的大模型训练和推理部署流程;同时,解决方案内置了大模型推理引擎、调优工具和算子加速库,支撑客户开箱即用,无需进行二次硬件适配,即可让客户能够直接使用大型预训练模型,从而降低了技术门槛;结合昇腾AI基础软硬件能力和伙伴模型和平台优势,通过嵌入四家伙伴各自在大模型训练、微调和优化方面的算法和模型能力,共同设计、联合开发、协同上市、持续迭代,实现为客户提供更全面的解决方案,更能满足全场景、全行业客户使用。
昇腾AI大模型训推一体化解决方案重塑了大模型开发流程,让大模型在行业充分发挥价值,帮助客户更好地应用大型深度学习模型。未来,华为也将继续携手合作伙伴,共同推动大模型与行业的深度融合与应用落地,为更多行业提供高效的解决方案,加速全场景、全行业应用成果落地。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。