两家公司都强调,已签署的合同依然有效,并将这一举动描述为正常的容量管理。微软表示,其财政年度(至 6 月结束)仍计划投入 800 亿美元。AWS 全球数据中心副总裁在 LinkedIn 上写道,“我们近期的扩展计划并未发生任何根本性变化。”
AI 建设确实在进行,但步伐可能正在发生变化。虽然云服务提供商在公开场合坚持扩展计划未变,但最近的租赁暂停暗示幕后正进行更为谨慎的重新调整——这预示着 AI 热潮可能不会以亚马逊和微软预期的那种不懈速度推进。
这种转变的一种解释是单纯的过度投入。根据 CNBC 的报道,上周 UBS 发布的一份报告得出结论,微软此轮撤退可能源于在最初的 AI 热潮期间投入过度。报告称,微软在两年内的租赁资本支出增长了 6.7 倍,目前租赁义务总额约为 1750 亿美元。随着对这项技术实际应用方式和电力需求有了更清晰的认识,微软正在取消那些不再具备即时意义的早期项目。UBS 表示,他们几乎没有发现突发的需求低迷是促使战略调整的主要原因。
AI 生态系统内部的成本压力不断累积。仅在计算能力上,对 OpenAI 最先进模型的一次查询可能就花费高达 1000 美元。尽管 ChatGPT 的高级访问服务每月收费 200 美元,但 OpenAI CEO Sam Altman 在一月份表示,该订阅服务尚未实现盈利。
即便是科技高管也开始承认炒作与实际成果之间存在差距。微软 CEO Satya Nadella 最近坦言,迄今为止,AI 尚未产生多少可衡量的价值。他的言论反映出更广泛的疑虑,即生成式 AI 是否能够带来可持续回报——或基础设施投资是否已远远超前于现实需求。
外部因素正在加剧这一挑战。特朗普总统提出的关税政策使进口设备成本大幅上升的可能性增大,而科技股在更广泛的市场波动中也承受着压力。与此同时,许多地区正面临电网容量的限制,这限制了新增数据中心的能力;各地对大型设施的反对声音也在不断增强,因为社区对不断上升的电力需求、土地使用和水资源消耗表示担忧。
未来 AI 基础设施的规模可能会显著放大这些压力。根据乔治城大学、Epoch AI 与 RAND Corporation 的研究人员近期的一项研究,如果当前趋势持续,到 2030 年,领先的 AI 数据中心每个可能将耗资 2000 亿美元,内含 200 万个 AI 芯片,并需要相当于九座核反应堆的电力。
这一撤退恰逢前所未有的投资热潮。据 Synergy Research Group 表示,目前全球有超过 500 个数据中心设施正处于规划和建设阶段。该机构称,亚马逊、微软和 Google (GOOGL) 现在占据了所有超大规模数据中心容量的 59%。每家公司都承诺将投入数十亿美元于资本支出,主要用于支撑生成式 AI 模型。
与此同时,AI 基础设施支出与 AI 创收之间的差距持续扩大。Sequoia Capital 合伙人 David Cahn 在 2024 年 6 月的一项分析中估计,这一不匹配现已膨胀成一个 6000 亿美元的缺口——而仅在九个月前,这一差距还仅为 2000 亿美元。
目前,云服务提供商仍坚持他们的公开声明:扩展计划保持不变。但那些较为低调的信号——租赁暂停、早期项目取消、成本上升以及快速变化的竞争态势——表明,幕后情况远比表面上看起来更为复杂。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。