两家公司都强调,已签署的合同依然有效,并将这一举动描述为正常的容量管理。微软表示,其财政年度(至 6 月结束)仍计划投入 800 亿美元。AWS 全球数据中心副总裁在 LinkedIn 上写道,“我们近期的扩展计划并未发生任何根本性变化。”
AI 建设确实在进行,但步伐可能正在发生变化。虽然云服务提供商在公开场合坚持扩展计划未变,但最近的租赁暂停暗示幕后正进行更为谨慎的重新调整——这预示着 AI 热潮可能不会以亚马逊和微软预期的那种不懈速度推进。
这种转变的一种解释是单纯的过度投入。根据 CNBC 的报道,上周 UBS 发布的一份报告得出结论,微软此轮撤退可能源于在最初的 AI 热潮期间投入过度。报告称,微软在两年内的租赁资本支出增长了 6.7 倍,目前租赁义务总额约为 1750 亿美元。随着对这项技术实际应用方式和电力需求有了更清晰的认识,微软正在取消那些不再具备即时意义的早期项目。UBS 表示,他们几乎没有发现突发的需求低迷是促使战略调整的主要原因。
AI 生态系统内部的成本压力不断累积。仅在计算能力上,对 OpenAI 最先进模型的一次查询可能就花费高达 1000 美元。尽管 ChatGPT 的高级访问服务每月收费 200 美元,但 OpenAI CEO Sam Altman 在一月份表示,该订阅服务尚未实现盈利。
即便是科技高管也开始承认炒作与实际成果之间存在差距。微软 CEO Satya Nadella 最近坦言,迄今为止,AI 尚未产生多少可衡量的价值。他的言论反映出更广泛的疑虑,即生成式 AI 是否能够带来可持续回报——或基础设施投资是否已远远超前于现实需求。
外部因素正在加剧这一挑战。特朗普总统提出的关税政策使进口设备成本大幅上升的可能性增大,而科技股在更广泛的市场波动中也承受着压力。与此同时,许多地区正面临电网容量的限制,这限制了新增数据中心的能力;各地对大型设施的反对声音也在不断增强,因为社区对不断上升的电力需求、土地使用和水资源消耗表示担忧。
未来 AI 基础设施的规模可能会显著放大这些压力。根据乔治城大学、Epoch AI 与 RAND Corporation 的研究人员近期的一项研究,如果当前趋势持续,到 2030 年,领先的 AI 数据中心每个可能将耗资 2000 亿美元,内含 200 万个 AI 芯片,并需要相当于九座核反应堆的电力。
这一撤退恰逢前所未有的投资热潮。据 Synergy Research Group 表示,目前全球有超过 500 个数据中心设施正处于规划和建设阶段。该机构称,亚马逊、微软和 Google (GOOGL) 现在占据了所有超大规模数据中心容量的 59%。每家公司都承诺将投入数十亿美元于资本支出,主要用于支撑生成式 AI 模型。
与此同时,AI 基础设施支出与 AI 创收之间的差距持续扩大。Sequoia Capital 合伙人 David Cahn 在 2024 年 6 月的一项分析中估计,这一不匹配现已膨胀成一个 6000 亿美元的缺口——而仅在九个月前,这一差距还仅为 2000 亿美元。
目前,云服务提供商仍坚持他们的公开声明:扩展计划保持不变。但那些较为低调的信号——租赁暂停、早期项目取消、成本上升以及快速变化的竞争态势——表明,幕后情况远比表面上看起来更为复杂。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。