两家公司都强调,已签署的合同依然有效,并将这一举动描述为正常的容量管理。微软表示,其财政年度(至 6 月结束)仍计划投入 800 亿美元。AWS 全球数据中心副总裁在 LinkedIn 上写道,“我们近期的扩展计划并未发生任何根本性变化。”
AI 建设确实在进行,但步伐可能正在发生变化。虽然云服务提供商在公开场合坚持扩展计划未变,但最近的租赁暂停暗示幕后正进行更为谨慎的重新调整——这预示着 AI 热潮可能不会以亚马逊和微软预期的那种不懈速度推进。
这种转变的一种解释是单纯的过度投入。根据 CNBC 的报道,上周 UBS 发布的一份报告得出结论,微软此轮撤退可能源于在最初的 AI 热潮期间投入过度。报告称,微软在两年内的租赁资本支出增长了 6.7 倍,目前租赁义务总额约为 1750 亿美元。随着对这项技术实际应用方式和电力需求有了更清晰的认识,微软正在取消那些不再具备即时意义的早期项目。UBS 表示,他们几乎没有发现突发的需求低迷是促使战略调整的主要原因。
AI 生态系统内部的成本压力不断累积。仅在计算能力上,对 OpenAI 最先进模型的一次查询可能就花费高达 1000 美元。尽管 ChatGPT 的高级访问服务每月收费 200 美元,但 OpenAI CEO Sam Altman 在一月份表示,该订阅服务尚未实现盈利。
即便是科技高管也开始承认炒作与实际成果之间存在差距。微软 CEO Satya Nadella 最近坦言,迄今为止,AI 尚未产生多少可衡量的价值。他的言论反映出更广泛的疑虑,即生成式 AI 是否能够带来可持续回报——或基础设施投资是否已远远超前于现实需求。
外部因素正在加剧这一挑战。特朗普总统提出的关税政策使进口设备成本大幅上升的可能性增大,而科技股在更广泛的市场波动中也承受着压力。与此同时,许多地区正面临电网容量的限制,这限制了新增数据中心的能力;各地对大型设施的反对声音也在不断增强,因为社区对不断上升的电力需求、土地使用和水资源消耗表示担忧。
未来 AI 基础设施的规模可能会显著放大这些压力。根据乔治城大学、Epoch AI 与 RAND Corporation 的研究人员近期的一项研究,如果当前趋势持续,到 2030 年,领先的 AI 数据中心每个可能将耗资 2000 亿美元,内含 200 万个 AI 芯片,并需要相当于九座核反应堆的电力。
这一撤退恰逢前所未有的投资热潮。据 Synergy Research Group 表示,目前全球有超过 500 个数据中心设施正处于规划和建设阶段。该机构称,亚马逊、微软和 Google (GOOGL) 现在占据了所有超大规模数据中心容量的 59%。每家公司都承诺将投入数十亿美元于资本支出,主要用于支撑生成式 AI 模型。
与此同时,AI 基础设施支出与 AI 创收之间的差距持续扩大。Sequoia Capital 合伙人 David Cahn 在 2024 年 6 月的一项分析中估计,这一不匹配现已膨胀成一个 6000 亿美元的缺口——而仅在九个月前,这一差距还仅为 2000 亿美元。
目前,云服务提供商仍坚持他们的公开声明:扩展计划保持不变。但那些较为低调的信号——租赁暂停、早期项目取消、成本上升以及快速变化的竞争态势——表明,幕后情况远比表面上看起来更为复杂。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
JETSPEC是由UC San Diego等机构联合提出的推测解码框架,通过树形因果掩码让草稿头在一次前向传播中生成分支一致的候选树,在MATH-500上实现最高9.64倍端到端加速。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。