伯克利大学研究者用AI构建更强负载均衡算法

加州大学伯克利分校研究团队利用OpenEvolve开源工具，成功将专家并行负载均衡算法性能提升5倍。该算法用于大型语言模型中将令牌路由到专门的专家模块。研究人员通过AI驱动的系统研究方法，让AI模型迭代生成、评估和优化解决方案，仅花费不到10美元和5小时就实现了显著性能提升。研究表明AI在算法设计中的巨大潜力，未来有望广泛应用于系统性能优化领域。

加州大学伯克利分校的计算机科学家表示，AI模型在算法发现和优化方面展现出巨大潜力。

在一篇题为"Barbarians at the Gate: How AI is Upending Systems Research"的预印本论文中，17名伯克利大学研究人员描述了他们如何使用OpenEvolve（Google DeepMind的AlphaEvolve开源实现）来改进负载均衡算法，显著超越了之前的人工设计。

具体来说，作者声称使用OpenEvolve实现了专家并行负载均衡器（EPLB）算法的5倍加速。该算法用于大语言模型中，将Token路由到专门的专家模块，这是一种减少处理参数数量的效率机制。

作者表示，通过AI驱动的系统研究（ADRS），AI模型可以迭代生成、评估和优化解决方案，有望改变系统研究。论文指出："随着AI在算法设计中发挥核心作用，我们认为人类研究者将越来越专注于问题制定和战略指导。我们的结果突出了破坏性潜力以及在AI时代适应系统研究实践的迫切需要。"

Google在5月份推广了AlphaEvolve，这是一个"进化编码智能体"，它提高了Google数据中心编排的效率，优化了张量处理单元硬件中的矩阵乘法操作，并优化了基于Transformer的AI模型中的FlashAttention内核实现。

为了进一步强调机器学习作为算法发现机制的潜力，本周发表在《自然》杂志上的一篇来自Google DeepMind研究人员的论文描述了"一种通过多代智能体与各种环境交互的经验来自主发现强化学习规则的方法"。到目前为止，DeepMind研究人员声称，自动化方法未能超越人类设计的强化学习系统。

伯克利大学团队现在通过让OpenEvolve找出处理大语言模型推理的GPU负载均衡的更高效方法，展示了基于AI优化工作的价值。

研究人员从DeepSeek的开源EPLB实现开始，他们指出该实现速度较慢，因为它用Python编写并依赖for循环来进行线性搜索以找到处理专家模块工作负载的最佳GPU。平均而言，DeepSeek版本需要约540毫秒来重新平衡GPU上的专家模块。

他们还研究了来自一个未公开前沿实验室的非公开EPLB实现，该实现在19.6毫秒内处理重新平衡。

OpenEvolve使用80%的Gemini 2.5 Flash和20%的Gemini 2.5 Flash Lite组合，成本不到10美元，用时5小时，提出了一种将专家模块打包到GPU中的更高效方法——它用向量化张量操作替换了循环，并实现了锯齿分区方案，运行时间仅为3.7毫秒。

这比未公开的参考实现快5.0倍，比DeepSeek的实现快146倍。

伯克利大学论文中描述的另一个案例研究报告称，通过使用OpenEvolve，作者能够将关系分析的速度提高3倍，其中SQL查询对每行调用大语言模型推理操作。

当被问及OpenEvolve的"推理"是否只是连接人们在可用数据中遗漏的点，还是显示出新颖方法的证据时，共同作者、伯克利大学博士候选人Audrey Cheng通过电子邮件告诉The Register："我认为这些问题很难明确回答（因为它们归结为大语言模型是否真正在'思考'或只是进行复杂的概率计算）。"

"大语言模型确实受益于在比任何个人研究者能够理解的更大文献语料库上的训练，这使它在发现应用其他领域思想的新方法方面具有优势。目前在系统/数据库性能研究中，如果算法在某种程度上显示出显著改进，我们就认为算法是'新颖的'，即使它们借用了其他领域的思想（例如，见我的将网络/操作系统公平共享思想应用于数据库的论文）。基于这个标准，是的，这些发展将被研究标准认为是新颖的。"

当被问及OpenEvolve是否只是从已知数据中暴力破解新颖性还是具有"创造性"时，Cheng说这也是一个困难的问题。

"我认为思考这个问题的一种方式是思考人类现在如何想出想法，"Cheng说。"作为研究者，我们知道我们'站在巨人的肩膀上'。只有深入理解他人的想法，我们才能想出'新颖的'解决方案。创造过程需要已知数据。OpenEvolve使用这些数据并将其应用于新问题（也可能想出意想不到的解决方案）。所以，我会说ADRS框架是有创造性的。"

Cheng说她相信ADRS的潜在影响是巨大的。

"我们专注于系统性能问题，因为AI已经可以在这里击败人类专家解决方案，"她解释道。"性能问题通常更容易验证，我们已经在行业中看到了一些初步采用（例如，见Datadog最近的博客文章）。我预期大多数大规模运行系统的公司最终将使用某种形式的ADRS进行性能调优。"

一旦研究人员弄清楚如何对安全性和容错性等其他问题进行验证，Cheng期望ADRS能够提出更多新颖的解决方案。

"目前的瓶颈是拥有强大的评估和验证框架，"她解释道。"如果这些到位，我想象ADRS可以广泛应用于各种系统问题（也超越计算机科学）。"

Q&A

Q1：OpenEvolve是什么？它有什么作用？

A：OpenEvolve是Google DeepMind的AlphaEvolve的开源实现，它是一个"进化编码智能体"。在这项研究中，OpenEvolve被用来改进负载均衡算法，通过向量化张量操作和锯齿分区方案，将专家并行负载均衡器的运行时间从19.6毫秒缩短到3.7毫秒，实现了5倍加速。

Q2：AI驱动的系统研究能做什么？

A：AI驱动的系统研究（ADRS）可以让AI模型迭代生成、评估和优化解决方案。目前主要用于系统性能问题，因为AI已经能够超越人类专家解决方案。研究显示，这种方法不仅能优化负载均衡算法，还能将关系分析中SQL查询调用大语言模型推理操作的速度提高3倍。

Q3：使用OpenEvolve优化算法的成本高吗？

A：成本相对较低。研究中使用80%的Gemini 2.5 Flash和20%的Gemini 2.5 Flash Lite组合，总成本不到10美元，用时5小时就完成了专家并行负载均衡器算法的优化，实现了显著的性能提升。

来源：The Register

0赞

好文章，需要你的鼓励

伯克利大学研究者用AI构建更强负载均衡算法

来源：The Register

2025

10/27

09:55

分享

点赞

生命科学计算测试专委会正式成立，BioProfile框架引领行业标准建设

超智算完成北京核心智算中心资产收购，加速构筑“3+X”全国算力网络新格局

走出“参数崇拜”：联想用“一体多端”重塑“人的尺度”

从“单点突破”到“一体多端”：拆解天禧AI 3.5进化背后三年的进化哲学

openGauss Summit 2025在京召开，加速行业智能化变革，共建繁荣数据库生态

2025联想天禧AI生态伙伴大会：天禧AI一体多端，与开发者共建个人AI生态

西班牙病毒如何将谷歌带到马拉加

LangChain核心库曝出严重漏洞，AI智能体机密信息面临泄露风险

Mill如何与亚马逊和全食超市达成合作协议

TechCrunch创业大赛中的9家顶尖生物技术初创公司

2025年印度科技领域十大重要发展

中科大发布Live Avatar：AI数字人无限聊天不翻车

Sora iOS版将新增三大功能，带来更强视频创作体验

AI助力长寿研究取得新进展

谷歌与IonQ在量子计算领域取得重大突破

亚马逊AWS现出颓势 竞争对手猛力追击

生成式AI使用文本图像而非纯文本作为Token的惊人创新

三星谷歌联手打造未来智能眼镜新形态

AI基础设施推动循环经济模式兴起

微软为Copilot推出Mico虚拟角色及新增自动化协作功能

Google与Anthropic签署百亿TPU合作协议推进AI发展

EA与Stable Diffusion背后公司合作，用AI制作游戏

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

亚马逊AWS现出颓势竞争对手猛力追击