Google已宣布将约3万个生产包移植到Arm架构,并计划全面转换,以便在自研Axion芯片和x86处理器上运行工作负载。
这家搜索和广告巨头在上周发布的预印本论文《仓库规模的指令集迁移》以及周三的一篇文章中记录了这一举措,披露YouTube、Gmail和BigQuery已经在x86和Axion Arm CPU上运行,还有约3万个应用程序也实现了双架构运行。
两份文档都详细说明了Google的迁移过程。工程研究员Parthasarathy Ranganathan和开发者关系工程师Wolff Dobson表示,迁移工作最初假设"我们会在架构差异上花费时间,比如浮点偏移、并发性、平台特定操作符等内在函数以及性能问题"。
"起初,我们使用典型的软件实践迁移了一些顶级作业,如F1、Spanner和Bigtable,包括每周会议和专门的工程师,"两人写道。"在这个早期阶段,我们确实发现了上述问题的证据,但远没有我们预期的那么多。事实证明,现代编译器和消毒剂等工具已经解决了大部分意外情况。"
Google开发人员最终将大部分时间花在了以下工作上:
修复因过度拟合现有x86服务器而损坏的测试
更新复杂的构建和发布系统,通常针对最老和流量最高的服务
解决生产配置中的推出问题
注意避免破坏关键系统的稳定性
这篇文章和论文详细介绍了对3万个应用程序的工作,这是一个足够庞大的代码集合,Google将其现有的自动化工具投入使用,然后构建了一个名为"CogniPort"的新AI工具来完成其他工具无法完成的任务。
"CogniPort专门处理构建和测试错误,"Ranganathan和Dobson写道。"如果在过程中的任何时刻,Arm库、二进制文件或测试无法构建,或测试因错误而失败,智能体就会介入并自动修复问题。作为第一步,我们已经使用CogniPort的Blueprint编辑模式生成不适合简单更改的迁移提交。"
Google发现该智能体在特定条件下约30%的时间内成功,在测试修复、平台特定条件和数据表示修复方面表现最佳。
这个成功率并不算很高,但Google至少还有7万个包需要移植。
该公司的目标是完成这项工作,使其著名的Borg集群管理器(Kubernetes的基础)能够以有效利用Arm服务器的方式分配内部工作负载。
这样做可能会节省资金,因为Google声称其Axion驱动的机器比x86实例提供高达65%的更好性价比,能效可提高60%。
这些数字以及Google代码迁移项目的规模表明,这家网络巨头在未来几年将需要更少的x86处理器。
Q&A
Q1:CogniPort是什么?它在Google的Arm迁移中起什么作用?
A:CogniPort是Google开发的AI工具,专门用于处理代码迁移过程中的构建和测试错误。当Arm库、二进制文件或测试无法构建或测试失败时,CogniPort会自动介入修复问题。它在特定条件下约30%的时间内成功,特别擅长处理测试修复、平台特定条件和数据表示修复。
Q2:Google为什么要将工作负载从x86迁移到Arm架构?
A:Google迁移到Arm架构主要是为了节省成本和提高能效。据Google声称,其Axion驱动的Arm机器比x86实例提供高达65%的更好性价比,能效可提高60%。通过在Arm和x86双架构上运行,Google的Borg集群管理器可以更有效地分配工作负载。
Q3:Google的Arm迁移项目规模有多大?目前进展如何?
A:Google已经将约3万个生产包移植到Arm架构,包括YouTube、Gmail和BigQuery等核心服务。但该公司还有至少7万个包需要移植。Google计划全面转换所有内部工作负载,使其能够在自研Axion芯片和x86处理器上运行。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。