MiniMax M1模型挑战中国大语言模型霸主地位

上海AI公司MiniMax发布开源推理模型M1，在性能和成本方面挑战DeepSeek、OpenAI等竞争对手。该模型采用Apache许可证真正开源，支持100万token输入和8万token输出，上下文窗口是DeepSeek R1的8倍。MiniMax声称其Lightning Attention机制使M1在处理长上下文推理时仅需DeepSeek R1约30%的算力，大幅降低计算成本。

总部位于上海的人工智能公司MiniMax发布了一款开源推理模型，在性能和成本方面对中国竞争对手DeepSeek以及美国的Anthropic、OpenAI和Google发起挑战。

MiniMax-M1于周一基于Apache软件许可证发布，因此是真正的开源模型，这与Meta的Llama系列（采用非开源的社区许可证）和DeepSeek（仅部分采用开源许可证）形成鲜明对比。

MiniMax在博客文章中自豪地表示："在复杂的生产力导向场景中，M1的能力在开源模型中名列前茅，超越了国内闭源模型，接近领先的海外模型，同时提供业界最佳的成本效益。"

根据博客文章，M1在多个基准测试（AIME 2024、LiveCodeBench、SWE-bench Verified、Tau-bench和MRCR）上与OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1、DeepSeek R1-0528和Qwen3-235B展开竞争，在不同程度上领先或落后于其他模型。虽然供应商提供的基准测试结果需要谨慎对待，但源代码已在GitHub上公开，用户可以独立验证其性能。

MiniMax明确表示要取代DeepSeek成为行业颠覆者，特别强调其上下文窗口（能够处理的输入量）达到100万个token，与Google Gemini 2.5 Pro相当，是DeepSeek R1容量的八倍。

在输出方面，该模型可以处理8万个token，优于DeepSeek的6.4万token容量，但略逊于OpenAI o3的10万token输出能力。

得到阿里巴巴集团、腾讯和IDG资本支持的MiniMax声称，其Lightning Attention机制通过改善注意力矩阵计算方式，提高了训练和推理效率，使M1模型在处理长上下文输入和推理时具有优势。

该公司声称："例如，在执行8万token的深度推理时，它只需要DeepSeek R1约30%的计算能力。这一特性使我们在训练和推理方面都具有显著的计算效率优势。"

这种更高效的计算方法，结合名为CISPO的改进强化学习算法（详见M1技术报告），转化为更低的计算成本。

MiniMax声称："整个强化学习阶段仅使用512块英伟达H800芯片运行三周，租赁成本仅为53.74万美元。这比最初预期少了一个数量级。"

来源：The Register

0赞

好文章，需要你的鼓励

MiniMax M1模型挑战中国大语言模型霸主地位

来源：The Register

2025

06/18

11:39

分享

点赞

数智惠闽企，展车进福州｜华为坤灵中国行2025·福建站成功举办，推动闽企智能化发展新征程

AI时代的影像实验：记录你眼中的“变化”

大象转身，亦或重塑大象：Unity团结引擎的“中国本土”进化

无万卡，不VLA：元戎启行与阿里云的“想法”和“解法”

AI爬虫让“价格战”变成“算法战”，利润正在被看不见的流量吞噬 AI 爬虫程序流量在短短一年内暴增 300%

做好可持续数字化转型的“必答题”

SUSE Linux Enterprise Server (SLES) 16全新发布：AI赋能，智领企业管理

SAP商业AI获乌镇峰会精品案例奖，助推中国企业实现确定性增长

专访｜Cloudera致力于打造AI时代的企业级“数据操作系统”

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

SAP TechEd柏林观察：企业AI如何发挥飞轮效应?

CIO策略观察——软件测试：从传统困局到 AI 无人测试转型

Sword Health获4000万美元融资，估值达40亿美元，IPO计划推迟至2028年

红杉投资的Crosby推出AI驱动的新型律师事务所

建筑公司发布"首个完全由AI设计的数据中心"项目

基础设施与治理是生成式AI采用的关键

制药业在价值链中部署AI，数据仍是挑战

AI促使领导者重新发现缺失的人文要素

掌握AI智能体的11个最佳在线课程

MiniMax-M1开源模型发布：百万级上下文窗口与超高效强化学习

AI正在重写数据规则手册——知识图谱是第一页

CrowdStrike发布AWS安全事件响应服务

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: