日本AI实验室Sakana AI开发了一种名为"自然生态位模型融合"(M2N2)的新型进化算法,让开发者能够在不进行昂贵训练和微调的情况下增强AI模型能力。该技术克服了其他模型融合方法的局限性,甚至能够从零开始进化出全新模型。
M2N2可应用于不同类型的机器学习模型,包括大语言模型和文本到图像生成器。对于寻求构建定制AI解决方案的企业而言,该方法通过结合现有开源模型的优势,提供了创建专业化模型的强大且高效的途径。
**什么是模型融合?**
模型融合是一种将多个专业化AI模型的知识整合到单一、更强大模型中的技术。与使用新数据对单个预训练模型进行微调不同,融合技术同时组合多个模型的参数。这个过程可以将丰富的知识整合到一个资产中,而无需昂贵的基于梯度的训练或访问原始训练数据。
对企业团队而言,这比传统微调提供了几个实际优势。论文作者向VentureBeat表示,模型融合是一个无梯度过程,只需要前向传播,使其在计算上比涉及昂贵梯度更新的微调更便宜。融合还避免了对精心平衡训练数据的需求,并减轻了"灾难性遗忘"的风险——即模型在学习新任务后丢失原有能力。当专业模型的训练数据不可用时,该技术特别强大,因为融合只需要模型权重本身。
早期的模型融合方法需要大量手动工作,开发者通过试错调整系数来找到最优组合。最近,进化算法通过搜索参数的最优组合帮助自动化这一过程。然而,仍存在重要的手动步骤:开发者必须为可融合参数(如层)设置固定集合。这种限制缩小了搜索空间,可能阻止发现更强大的组合。
**M2N2的工作原理**
M2N2通过从自然界的进化原理中汲取灵感来解决这些局限性。该算法具有三个关键特征,使其能够探索更广泛的可能性并发现更有效的模型组合。
首先,M2N2消除了固定的融合边界,如块或层。它使用灵活的"分割点"和"混合比例"来划分和组合模型,而不是按预定义层对参数分组。这意味着算法可能将模型A中某层30%的参数与模型B中同一层70%的参数融合。该过程从种子模型的"档案"开始。在每一步中,M2N2从档案中选择两个模型,确定混合比例和分割点,然后融合它们。如果生成的模型表现良好,就会被添加回档案,替换较弱的模型。
其次,M2N2通过竞争管理模型群体的多样性。为了理解多样性的重要性,研究人员提供了一个简单类比:"想象融合两张考试答题纸...如果两张纸的答案完全相同,组合它们不会带来任何改进。但如果每张纸在不同问题上有正确答案,融合它们会产生更强的结果。"M2N2模拟有限资源竞争,这种受自然启发的方法自然奖励具有独特技能的模型。
第三,M2N2使用称为"吸引力"的启发式方法来配对模型进行融合。"吸引力分数"识别一个模型在另一个模型感到困难的数据点上表现良好的配对,这提高了搜索效率和最终融合模型的质量。
**M2N2实践应用**
研究人员在三个不同领域测试了M2N2,证明了其多功能性和有效性。
首先,他们在MNIST数据集上从零开始进化基于神经网络的图像分类器。M2N2在测试准确率上大幅领先其他方法。
接下来,他们将M2N2应用于大语言模型,结合数学专家模型(WizardMath-7B)和智能体专家模型(AgentEvol-7B)。融合后的模型在数学问题和基于网络的任务上都实现了强劲表现。
最后,团队融合了基于扩散的图像生成模型,将日语提示训练的模型(JSDXL)与三个主要用英语提示训练的Stable Diffusion模型结合。融合模型不仅产生了更逼真的图像,还发展出了双语能力,能够从英语和日语提示生成高质量图像。
对于已经开发专业模型的企业而言,融合的商业案例令人信服。研究人员指出了难以通过其他方式实现的新型混合能力。例如,将针对说服性销售演示微调的大语言模型与训练解释客户反应的视觉模型融合,可以创建一个根据实时视频反馈调整演示的单一智能体。
展望未来,研究人员将M2N2等技术视为"模型融合"更广泛趋势的一部分。他们设想未来组织将维护整个AI模型生态系统,持续进化和融合以适应新挑战。
研究人员已在GitHub上发布了M2N2的代码。作者认为,这种动态、自我改进AI生态系统的最大障碍不是技术性的,而是组织性的——在由开源、商业和定制组件构成的大型"融合模型"世界中,确保隐私、安全和合规将是关键问题。
Q&A
Q1:M2N2算法是什么?它有什么优势?
A:M2N2是Sakana AI开发的"自然生态位模型融合"算法,是一种新型进化算法。它能够在不进行昂贵训练和微调的情况下增强AI模型能力,通过融合多个专业模型的参数来创建更强大的单一模型。相比传统微调,M2N2计算成本更低,无需梯度更新,还能避免灾难性遗忘问题。
Q2:M2N2算法的核心技术特征有哪些?
A:M2N2有三个关键特征:首先是消除固定融合边界,使用灵活的分割点和混合比例;其次是通过竞争机制管理模型群体多样性,模拟自然界有限资源竞争;第三是使用"吸引力"启发式方法配对模型,基于互补优势而非简单的顶级表现来选择融合对象。
Q3:M2N2算法在实际应用中效果如何?
A:M2N2在三个领域的测试中都表现出色:在MNIST图像分类任务中取得最高准确率;成功融合数学专家模型和智能体专家模型,创建了在两类任务上都表现优异的模型;在图像生成领域,融合后的模型不仅图像质量更高,还意外获得了双语能力,能同时理解英语和日语提示。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。