2023年7月6日,昇腾人工智能产业高峰论坛在上海举办。论坛现场,华为联合四家伙伴共同发布昇腾AI大模型训推一体化解决方案,加速大模型在各行业里快速落地应用。
随着深度学习领域的快速发展,越来越多的应用场景需要使用大模型来进行训练和推理。然而,企业在大模型开发全流程中,常常面临切换硬件集群、适配底层硬件以及微调优化等复杂问题。加之大模型研发周期长、部署门槛高等系列挑战,“攒机”式开发手段难以满足需求。
为有效解决以上问题,华为联合四家伙伴共同发布昇腾AI大模型训推一体化解决方案,实现了训推一体,提供了“开箱即用”的解决方案,同一个集群内可以无缝切换大模型的训练和推理过程,从而为客户提供高效的大模型训练和推理部署流程;同时,解决方案内置了大模型推理引擎、调优工具和算子加速库,支撑客户开箱即用,无需进行二次硬件适配,即可让客户能够直接使用大型预训练模型,从而降低了技术门槛;结合昇腾AI基础软硬件能力和伙伴模型和平台优势,通过嵌入四家伙伴各自在大模型训练、微调和优化方面的算法和模型能力,共同设计、联合开发、协同上市、持续迭代,实现为客户提供更全面的解决方案,更能满足全场景、全行业客户使用。
昇腾AI大模型训推一体化解决方案重塑了大模型开发流程,让大模型在行业充分发挥价值,帮助客户更好地应用大型深度学习模型。未来,华为也将继续携手合作伙伴,共同推动大模型与行业的深度融合与应用落地,为更多行业提供高效的解决方案,加速全场景、全行业应用成果落地。
好文章,需要你的鼓励
四川大学研究团队发现,当前先进的AI模型在面对信息不完整的数学问题时,缺乏主动询问澄清信息的能力,更倾向于基于假设给出答案。
中南大学等机构联合发布TextAtlas5M数据集,包含500万图像-文本对,专门解决AI长文本图像生成难题。该数据集平均文本长度148.82词,远超现有数据集,涵盖广告、学术、教育等真实场景。配套的TextAtlasEval基准测试显示,即使最先进的商业模型也面临显著挑战,为AI图像生成技术指明了新的发展方向。
从11岁就梦想造人形机器人的Bernt Bornich,用'huggable'形容他的Neo Gamma机器人——这个能举起150磅的66磅'运动员',正以家庭为试验场突破AI学习瓶颈:'工厂20小时就触及学习天花板,而家庭环境的多样性才是通往AGI的钥匙'。
剑桥大学研究团队创建了史上最难的AI视觉测试ZeroBench,包含100道精心设计的视觉推理题目。在这项测试中,包括GPT-4o、Claude、Gemini在内的20个全球最先进AI模型全部得了0分,暴露了当前AI在基础视觉理解上的严重缺陷。研究发现AI主要在计数、空间推理等基础任务上失败,而非逻辑推理能力不足。