近日,Alphabet Inc. 旗下的 Google DeepMind 单位详细介绍了 AlphaEvolve —— 一款能够应对复杂编程和数学挑战的人工智能代理。
该公司表示,已利用 AlphaEvolve 提高其数据中心的效率。此外,这款 AI 代理在数学研究和芯片开发方面也展现出巨大潜力。
AlphaEvolve 采用多步处理流程。当接到编程任务时,该代理借助 Google LLC 的轻量级 Gemini 2.0 Flash 大语言模型,生成多个代码片段。随后,一个自动评估机制会按质量对这些代码片段进行排序。接着,AlphaEvolve 选取最优代码片段,并请求 Gemini 2.0 Flash 对其进行改进。
该代理在多个轮次中对 AI 生成的代码不断进行优化。当 Gemini 2.0 Flash 无法再提供改进建议时,AlphaEvolve 切换到 Gemini 2.0 Pro —— 一款在牺牲部分速度的前提下能大幅提升输出质量的更强大模型。
DeepMind 研究人员在一篇研究论文中详细说明:“AlphaEvolve 的进化过程利用了现代大语言模型对反馈的响应能力,从而发现了在语法和功能上与原始候选池截然不同的候选方案。”
Google 已在多个内部项目中应用了 AlphaEvolve。其中几项举措侧重于矩阵乘法,这是一种 AI 模型用以处理数据的数学运算。矩阵即为将数字按类似电子表格的行和列排列而成的集合。
芯片设计师并非手绘处理器蓝图,而是使用一种称为 Verilog 的编程语法来编写蓝图。在其中一个项目中,AlphaEvolve 协助 Google 工程师优化了一块专为执行矩阵乘法设计的电路的 Verilog 代码。该公司已将这一电路纳入即将推出的 TPU 系列 AI 处理芯片中。
在另一个内部项目中,AlphaEvolve 开发出了一种方法,使 Google 的 Gemini 模型能够将矩阵乘法分解成更小、更易处理的计算任务。据这家搜索巨头表示,这些改进使 Gemini 最关键组件之一的运算速度提升了 23%。
AlphaGo 也帮助该公司提升了数据中心的效率。Google 通过一款名为 Borg 的软件平台管理其基础设施资源。DeepMind 的研究人员详细说明,AlphaEvolve 针对该平台提出的改进目前平均能回收 Google 全舰计算资源的 0.7%。
据这家搜索巨头称,正是使 AlphaEvolve 能够优化数据中心与芯片设计的推理能力,使其在数学研究领域同样大有可为。研究人员在伴随论文发布的一篇博客文章中写道:“为了探索 AlphaEvolve 的适用范围,我们将该系统应用于数学分析、几何、组合学和数论等 50 多个未解问题。该系统的灵活性使我们能在数小时内完成大部分实验。据我们所知,在约 75% 的实验中,它重新发现了最先进的解决方案。”
Google 计划通过早期访问项目向学术界提供这一 AI 代理。此外,该公司正研究未来向更多用户开放使用权限的可能性。
DeepMind 的研究人员写道:“虽然 AlphaEvolve 目前主要应用于数学和计算领域,但其通用性意味着它可被应用于任何解决方案可用算法描述并能自动验证的问题。我们相信,AlphaEvolve 有望在材料科学、药物发现、可持续性以及更广泛的技术与商业应用等众多领域带来变革。”
好文章,需要你的鼓励
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。