企业往往不愿公开承认这一点,但其云计算账单的很大一部分实际上源于一个看似平常但具有欺骗性的问题:低效的代码。
软件交付平台提供商Harness与AWS联合发布的研究报告显示,在美国和英国接受调查的700名工程师和开发人员中,52%的人表示,财务运营团队与开发人员之间的脱节正在导致云基础设施成本的浪费支出。
研究人员在报告中写道:"现实情况是,开发人员经常将成本优化视为别人的问题。这种脱节导致了资源过度配置、空闲实例以及消耗预算的低效架构。"
HFS Research首席执行官Phil Fersht表示,低效代码是这种脱节的重要组成部分,现在应该将其视为首席财务官层面的问题,因为AI工作负载正在增加功耗、碳成本和基础设施支出。
他说:"计算浪费巨大。大型云提供商的研究表明,20%到40%的云计算资源要么未充分利用,要么被低效代码消耗。企业为这种浪费买单。"
这种计算资源的隐性税收引起了AI编程助手提供商的关注。
谷歌通过推出新的编程智能体AlphaEvolve来解决这一问题,该智能体将重点从代码生成转向代码进化。
谷歌周三在博客文章中表示,这款由Gemini驱动的编程智能体目前处于私有预览阶段。
用户必须首先编写他们想要解决的问题定义、评估建议解决方案的测试,以及解决问题的代码初稿。然后,AlphaEvolve会迭代地应用Gemini大语言模型在代码中生成"变异",并对其进行测试,以确定它们是否比现有解决方案更好,直到满足测试标准。
分析师表示,通过改变底层算法来进化代码的能力可能会成为企业的游戏规则改变者。
Fersht说:"对于希望在路由、调度、预测和优化等领域提高性能的企业来说,代码进化功能强大。这些领域的算法改进直接转化为商业优势、降低计算成本和更好的上市时间。"
The Futurum Group数据、AI和基础设施实践负责人Bradley Shimmin表示,谷歌可能旨在帮助企业进化整个代码库,而不仅仅是帮助语法补全、代码生成和文档编制。
Fersht认为AlphaEvolve将推动企业改变开发人员长期以来遵循的做法:先编写代码,后优化。
Fersht说:"十年来,开发者文化优先考虑速度和框架而非优化。在计算便宜时这种做法有效。AI改变了这个等式。模型对计算资源需求巨大。"
Fersht补充说:"企业现在意识到,低效的代码会减慢模型速度,增加成本,并影响现实世界的性能。"他还表示,开发人员被迫在开发生命周期中更早而不是更晚地进行优化。
这种压力不仅仅是因为大语言模型的巨大处理能力需求:数据中心容量现在成为战略约束,因为AI推理负载的扩展速度超过了基础设施,Fersht说,任何提高代码效率的工具也会减少运行应用程序所需的GPU数量和电力消耗。
他说:"这就是为什么算法发现如此重要:它减少了对暴力计算的需求。"
用于代码进化的算法发现并不是供应商帮助企业优化编程相关计算资源支出的唯一方式。
法国大语言模型供应商Mistral推出了一款专门用于编程的紧凑型新开放大语言模型Devstral 2,声称其效果与更大的模型一样有效。较小的模型运行成本比较大的模型便宜,因为它们需要较少强大的硬件,并执行较少的计算来生成答案。
Anthropic也在努力支持开发人员,将Claude Code引入Slack,帮助他们生成更好的代码并减少协作时间。通常,Slack是开发团队讨论架构的地方,Claude Code在那里的集成将帮助编程智能体获得更好的上下文,生成与团队更相关的代码。
Q&A
Q1:AlphaEvolve是什么?它有什么特别之处?
A:AlphaEvolve是谷歌推出的由Gemini驱动的编程智能体,目前处于私有预览阶段。它的特别之处在于将重点从代码生成转向代码进化,通过迭代地在代码中生成"变异"并测试,直到满足测试标准,从而改变底层算法来进化代码。
Q2:为什么企业需要关注代码效率问题?
A:大型云提供商的研究表明,20%到40%的云计算资源要么未充分利用,要么被低效代码消耗,企业为这种浪费买单。随着AI工作负载增加功耗、碳成本和基础设施支出,低效代码现在应该被视为首席财务官层面的问题。
Q3:除了谷歌,还有哪些公司在解决代码效率问题?
A:法国大语言模型供应商Mistral推出了专门用于编程的紧凑型开放大语言模型Devstral 2,运行成本比大型模型便宜。Anthropic也将Claude Code引入Slack,帮助开发人员生成更好的代码并减少协作时间。
好文章,需要你的鼓励
传统AI依赖云端处理存在延迟和隐私问题。越来越多开发者将AI处理从数据中心转移到手机、笔记本等个人设备上。设备端AI具有三大优势:速度更快,无需等待云端响应;隐私更安全,数据不离开设备;成本更低,无需支付云服务费用。目前iPhone已运行30亿参数的设备端AI模型,谷歌Pixel手机也搭载Gemini Nano模型。未来五年内,随着硬件升级和算法优化,设备端AI将实现物体识别、导航翻译等更复杂功能。
这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。
卡内基梅隆大学研究人员开发了一项革命性技术,通过摄像头、AI模型和微型轮子,让咖啡杯、订书机等日常物品能够自主移动到需要的位置。这种"智能物品"技术避免了传统人形机器人的复杂性和安全隐患,通过蓝牙微控制器和AI视觉系统,物品能够识别用户行为并预测需求。虽然技术已相对成熟,但隐私保护和安全性仍是推广前需要解决的关键问题。
NVIDIA团队开发出Fast-FoundationStereo系统,成功解决了立体视觉AI在速度与精度之间的两难选择。通过分而治之的策略,该系统实现了超过10倍的速度提升同时保持高精度,包括知识蒸馏压缩特征提取、神经架构搜索优化成本过滤,以及结构化剪枝精简视差细化。此外,研究团队还构建了包含140万对真实图像的自动伪标注数据集,为立体视觉的实时应用开辟了新道路。