近日,Alphabet Inc. 旗下的 Google DeepMind 单位详细介绍了 AlphaEvolve —— 一款能够应对复杂编程和数学挑战的人工智能代理。
该公司表示,已利用 AlphaEvolve 提高其数据中心的效率。此外,这款 AI 代理在数学研究和芯片开发方面也展现出巨大潜力。
AlphaEvolve 采用多步处理流程。当接到编程任务时,该代理借助 Google LLC 的轻量级 Gemini 2.0 Flash 大语言模型,生成多个代码片段。随后,一个自动评估机制会按质量对这些代码片段进行排序。接着,AlphaEvolve 选取最优代码片段,并请求 Gemini 2.0 Flash 对其进行改进。
该代理在多个轮次中对 AI 生成的代码不断进行优化。当 Gemini 2.0 Flash 无法再提供改进建议时,AlphaEvolve 切换到 Gemini 2.0 Pro —— 一款在牺牲部分速度的前提下能大幅提升输出质量的更强大模型。
DeepMind 研究人员在一篇研究论文中详细说明:“AlphaEvolve 的进化过程利用了现代大语言模型对反馈的响应能力,从而发现了在语法和功能上与原始候选池截然不同的候选方案。”
Google 已在多个内部项目中应用了 AlphaEvolve。其中几项举措侧重于矩阵乘法,这是一种 AI 模型用以处理数据的数学运算。矩阵即为将数字按类似电子表格的行和列排列而成的集合。
芯片设计师并非手绘处理器蓝图,而是使用一种称为 Verilog 的编程语法来编写蓝图。在其中一个项目中,AlphaEvolve 协助 Google 工程师优化了一块专为执行矩阵乘法设计的电路的 Verilog 代码。该公司已将这一电路纳入即将推出的 TPU 系列 AI 处理芯片中。
在另一个内部项目中,AlphaEvolve 开发出了一种方法,使 Google 的 Gemini 模型能够将矩阵乘法分解成更小、更易处理的计算任务。据这家搜索巨头表示,这些改进使 Gemini 最关键组件之一的运算速度提升了 23%。
AlphaGo 也帮助该公司提升了数据中心的效率。Google 通过一款名为 Borg 的软件平台管理其基础设施资源。DeepMind 的研究人员详细说明,AlphaEvolve 针对该平台提出的改进目前平均能回收 Google 全舰计算资源的 0.7%。
据这家搜索巨头称,正是使 AlphaEvolve 能够优化数据中心与芯片设计的推理能力,使其在数学研究领域同样大有可为。研究人员在伴随论文发布的一篇博客文章中写道:“为了探索 AlphaEvolve 的适用范围,我们将该系统应用于数学分析、几何、组合学和数论等 50 多个未解问题。该系统的灵活性使我们能在数小时内完成大部分实验。据我们所知,在约 75% 的实验中,它重新发现了最先进的解决方案。”
Google 计划通过早期访问项目向学术界提供这一 AI 代理。此外,该公司正研究未来向更多用户开放使用权限的可能性。
DeepMind 的研究人员写道:“虽然 AlphaEvolve 目前主要应用于数学和计算领域,但其通用性意味着它可被应用于任何解决方案可用算法描述并能自动验证的问题。我们相信,AlphaEvolve 有望在材料科学、药物发现、可持续性以及更广泛的技术与商业应用等众多领域带来变革。”
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。