总部位于上海的人工智能公司MiniMax发布了一款开源推理模型,在性能和成本方面对中国竞争对手DeepSeek以及美国的Anthropic、OpenAI和Google发起挑战。
MiniMax-M1于周一基于Apache软件许可证发布,因此是真正的开源模型,这与Meta的Llama系列(采用非开源的社区许可证)和DeepSeek(仅部分采用开源许可证)形成鲜明对比。
MiniMax在博客文章中自豪地表示:"在复杂的生产力导向场景中,M1的能力在开源模型中名列前茅,超越了国内闭源模型,接近领先的海外模型,同时提供业界最佳的成本效益。"
根据博客文章,M1在多个基准测试(AIME 2024、LiveCodeBench、SWE-bench Verified、Tau-bench和MRCR)上与OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1、DeepSeek R1-0528和Qwen3-235B展开竞争,在不同程度上领先或落后于其他模型。虽然供应商提供的基准测试结果需要谨慎对待,但源代码已在GitHub上公开,用户可以独立验证其性能。
MiniMax明确表示要取代DeepSeek成为行业颠覆者,特别强调其上下文窗口(能够处理的输入量)达到100万个token,与Google Gemini 2.5 Pro相当,是DeepSeek R1容量的八倍。
在输出方面,该模型可以处理8万个token,优于DeepSeek的6.4万token容量,但略逊于OpenAI o3的10万token输出能力。
得到阿里巴巴集团、腾讯和IDG资本支持的MiniMax声称,其Lightning Attention机制通过改善注意力矩阵计算方式,提高了训练和推理效率,使M1模型在处理长上下文输入和推理时具有优势。
该公司声称:"例如,在执行8万token的深度推理时,它只需要DeepSeek R1约30%的计算能力。这一特性使我们在训练和推理方面都具有显著的计算效率优势。"
这种更高效的计算方法,结合名为CISPO的改进强化学习算法(详见M1技术报告),转化为更低的计算成本。
MiniMax声称:"整个强化学习阶段仅使用512块英伟达H800芯片运行三周,租赁成本仅为53.74万美元。这比最初预期少了一个数量级。"
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。