浪潮信息发布 “源2.0-M32” 开源大模型，大幅提升模算效率

5月28日，浪潮信息发布“源2.0-M32”开源大模型。

5月28日，浪潮信息发布“源2.0-M32”开源大模型。“源2.0-M32”在基于“源2.0”系列大模型已有工作基础上，创新性地提出和采用了“基于注意力机制的门控网络”技术，构建包含32个专家（Expert）的混合专家模型（MoE），并大幅提升了模型算力效率，模型运行时激活参数为37亿，在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

在算法层面，源2.0-M32提出并采用了一种新型的算法结构：基于注意力机制的门控网络（Attention Router），针对MoE模型核心的专家调度策略，这种新的算法结构关注专家模型之间的协同性度量，有效解决传统门控网络下，选择两个或多个专家参与计算时关联性缺失的问题，使得专家之间协同处理数据的水平大为提升。源2.0-M32采用源2.0-2B为基础模型设计，沿用并融合局部过滤增强的注意力机制（LFA, Localized Filtering-based Attention），通过先学习相邻词之间的关联性，然后再计算全局关联性的方法，能够更好地学习到自然语言的局部和全局的语言特征，对于自然语言的关联语义理解更准确，进而提升了模型精度。

Figure1- 基于注意力机制的门控网络（Attention Router）

在数据层面，源2.0-M32基于超过2万亿的token进行训练、覆盖万亿量级的代码、中英文书籍、百科、论文及合成数据。大幅扩展代码数据占比至47.5%，从6类最流行的代码扩充至619类，并通过对代码中英文注释的翻译，将中文代码数据量增大至1800亿token。结合高效的数据清洗流程，满足大模型训练“丰富性、全面性、高质量”的数据集需求。基于这些数据的整合和扩展，源2.0-M32在代码生成、代码理解、代码推理、数学求解等方面有着出色的表现。

在算力层面，源2.0-M32采用了流水并行的方法，综合运用流水线并行+数据并行的策略，显著降低了大模型对芯片间P2P带宽的需求，为硬件差异较大训练环境提供了一种高性能的训练方法。针对MOE模型的稀疏专家计算，采用合并矩阵乘法的方法，模算效率得到大幅提升。

浪潮信息发布 “源2.0-M32” 开源大模型，大幅提升模算效率
基于在算法、数据和算力方面全面创新，源2.0-M32的性能得以大幅提升，在多个业界主流的评测任务中，展示出了较为先进的能力表现，在MATH（数学竞赛）、ARC-C（科学推理）榜单上超越了拥有700亿参数的LLaMA3大模型。

Figure2 源2.0-M32业界主流评测任务表现

源2.0-M32大幅提升了模型算力效率，在实现与业界领先开源大模型性能相当的同时，显著降低了在模型训练、微调和推理所需的算力开销。在模型推理运行阶段，M32处理每token所需算力为7.4GFLOPs，而LLaMA3-70B所需算力为140GFLOPs。在模型微调训练阶段，对1万条平均长度为1024 token的样本进行全量微调，M32消耗算力约0.0026PD(PetaFLOPs/s-day)，而LLaMA3消耗算力约为0.05PD。M32凭借特别优化设计的模型架构，在仅激活37亿参数的情况下，取得了和700亿参数LLaMA3相当的性能水平，而所消耗算力仅相为LLaMA3的1/19，从而实现了更高的模算效率。

浪潮信息人工智能首席科学家吴韶华表示：当前业界大模型在性能不断提升的同时，也面临着所消耗算力大幅攀升的问题，对企业落地应用大模型带来了极大的困难和挑战。源2.0-M32是浪潮信息在大模型领域持续耕耘的最新探索成果，通过在算法、数据、算力等方面的全面创新，M32不仅可以提供与业界领先开源大模型相当的性能，更可以大幅降低大模型所需算力消耗。大幅提升的模算效率将为企业开发应用生成式AI提供模型高性能、算力低门槛的高效路径。M32开源大模型配合企业大模型开发平台EPAI（Enterprise Platform of AI），将助力企业实现更快的技术迭代与高效的应用落地，为人工智能产业的发展提供坚实的底座和成长的土壤，加速产业智能化进程。

源2.0-M32将持续采用全面开源策略，全系列模型参数和代码均可免费下载使用。

代码开源链接：https://github.com/IEIT-Yuan/Yuan2.0-M32
模型下载链接：

Huggingface：

https://huggingface.co/IEITYuan/Yuan2-M32-hf

ModelScope：

https://modelscope.cn/models/YuanLLM/Yuan2-M32-hf/summary

来源：业界供稿

浪潮信息

0赞

好文章，需要你的鼓励

浪潮信息发布 “源2.0-M32” 开源大模型，大幅提升模算效率

来源：业界供稿

2024

05/28

20:14

分享

点赞

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

端侧感知、私有闭环、量子协同， NVIDIA全栈异构计算范式“接管”实体产业底座

边缘智算筑基、全栈软硬协同，研华科技将AI带进产业闭环

千问AI眼镜将升级为智能体眼镜：能灵活调用Skill和Agent，能全天候感知

对话Moonix郭于晨：先让用户戴上“眼镜”，再让“AI”记录世界

亮相WAIC 2026，临床实证赋能康养升级 无芯科技定义AI疗愈新范式

生态覆盖持续扩散，一文看懂各行业企业鸿蒙化转型进度

WAIC亮出集群协作真功夫，优艾智合领跑工业具身智能规模化

国内首款42kW智算风冷算力仓！能投天府云与浪潮信息联合发布

服务器定制备料分分钟完成！浪潮信息超大智能立体仓库投入运营

浪潮信息与龙蜥社区联合发布！服务器操作系统KOS V5.8，并推出“停更无忧”计划

浪潮信息与五家算力运营公司在南京签署战略合作 加速华东智算基础设施布局

分布式数据库时代，需要什么样的产品？浪潮信息携手腾讯云给出答案！

CCF信息存储技术专委会走进浪潮信息 共话大模型时代的存储创新之道

独辟蹊径 浪潮信息 “源2.0-M32”多维度提升模型算力效率

浪潮信息发布 “源2.0-M32” 开源大模型，大幅提升模算效率

为大模型专门优化！浪潮信息发布分布式全闪存储AS13000G7-N系列

浪潮信息彭震：激发创新活力，加速AI落地

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

亮相WAIC 2026，临床实证赋能康养升级无芯科技定义AI疗愈新范式

浪潮信息与五家算力运营公司在南京签署战略合作加速华东智算基础设施布局

CCF信息存储技术专委会走进浪潮信息共话大模型时代的存储创新之道

独辟蹊径浪潮信息 “源2.0-M32”多维度提升模型算力效率