亚马逊云服务 (AWS) 正在努力获取建设 AI 基础设施所需的高质量服务器,并提前报废了其他硬件以为加速计算设备腾出空间。
这些 AWS 基础设施状况的细节来自 CEO Andy Jassy 和 CFO Brian Olsavsky,他们在周四的财报电话会议上披露了这些信息,会上亚马逊详细介绍了 2024 财年业绩并概述了未来计划。
Olavsky 在准备好的讲话中透露,亚马逊最近进行了一项"使用寿命研究",研究对象是其服务器和网络设备,发现"特别是在人工智能和机器学习领域,技术发展速度加快"。
这些发现意味着该公司决定从 2025 年 1 月起,将部分服务器和网络设备的使用寿命从六年缩短到五年。亚马逊还因未说明的原因提前报废了一些其他服务器和网络设备。
就在一年前,亚马逊将其服务器的工作寿命从五年延长到六年,这比 2022 年确定的五年期限有所增加。
在电话会议上,一位华尔街分析师询问 AWS 的 AI 基础设施建设是否受到供应链问题的阻碍。
Jassy 承认确实如此。
"如果不是因为一些产能限制,我们可能会增长得更快,"他承认说,并补充道"来自第三方合作伙伴的芯片供应比以前慢了一些。"
他还表示,"要让硬件达到我们预期的健康和高质量服务器的比例需要一定时间。"
服务器主板等组件的短缺也是一个制约因素,能源供应同样如此。
供应问题很重要,因为亚马逊在 2024 年第四季度的资本支出达到 264 亿美元,Olavsky 表示其中大部分用于 AWS 的 AI 基础设施。首席财务官表示,264 亿美元将是亚马逊 2025 财年季度资本支出的典型水平,这意味着全年硬件支出接近 1000 亿美元。
在中国模型开发商 DeepSeek 声称能够在较短时间内用普通硬件训练其产品后,AI 基础设施支出成为一个热门话题,这表明大规模建设可能无法收回成本。
Jassy 表示亚马逊对此类论点并不担心,因为"我们认为今天我们所知道的几乎每个应用程序都将通过 AI 重新发明,推理将成为像计算、存储和数据库一样的核心构建模块。"
这位 CEO 表示,AWS 增长越快,其资本支出就增长越多,"因为我们必须在能够实现盈利之前采购数据中心、硬件、芯片和网络设备。"
"除非我们看到显著的需求信号,否则我们不会采购,"他说。"因此,当 AWS 扩大资本支出时,特别是在我们认为 AI 代表的这种千载难逢的商业机会中,我认为这实际上是 AWS 业务中长期发展的一个非常好的信号。"
AWS 已经显示出良好的发展势头,年收入达到 1076 亿美元,比去年增长 19%。AWS 第四季度收入为 290 亿美元,这意味着其年收入运行率为 1150 亿美元。相比之下,戴尔最近一个完整财年的收入为 885 亿美元,IBM 为 628 亿美元,思科实现 538 亿美元的收入,惠普企业获得 301 亿美元。微软的年收入为 2451 亿美元遥遥领先 - 但很难从微软的收入中分离出消费者、游戏和广告收入来直接比较商业技术收入。我们认为 AWS 目前落后几百亿美元。
亚马逊 2024 年 12 月 31 日结束的财年收入为 6380 亿美元,比 2023 财年的 5748 亿美元增长 11%。净收入为 592 亿美元,几乎是 2023 财年 304 亿美元的两倍。
该公司认为,随着更多投资机器人技术,这些数字将会改善,这也将占据资本支出的一部分。Jassy 表示,亚马逊已经运行的 1000 多个生成式 AI 应用程序也可能有所帮助。亚马逊使用生成式 AI 的方式包括:
- 一个面向第三方卖家的应用程序,让他们"拍摄图片或指向 URL,生成式 AI 应用程序将填写他们必须填写的大部分其他信息,这加快了网站上商品信息的填写速度,让卖家更容易操作。"
- 一个比较不同服装制造商目录的工具,意味着亚马逊知道"哪些品牌相对于其他品牌的尺码偏大或偏小。因此,当你来买一双鞋时,它可以推荐你需要的尺码。"
- 在亚马逊 Prime 的美式足球转播中,AI 帮助发布"防守预警,我们预测哪个球员将突袭四分卫,或防守漏洞,我们能够向观众展示场地的哪个区域容易被突破。"
随着 2025 年的展开,Jassy 表示,亚马逊购物者将更频繁地看到其"Rufus"代理出现并提供购买建议。
投资者被告知,2025 年第一季度收入将达到 1510 亿至 1555 亿美元,增长在 5% 到 9% 之间。为了解释指导数据可能偏低的原因,亚马逊提醒股东 2024 年是闰年,2 月 29 日多出的一天交易意味着额外 15 亿美元的销售额。
投资者并不兴奋,盘后交易中亚马逊股价从每股 239 美元以上跌至略高于 229 美元。
第一季度预测似乎是股东缺乏热情的原因之一。AWS 的增长率可能是另一个原因,因为它的加速速度比谷歌和微软的竞争对手慢。
好文章,需要你的鼓励
这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。
卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。
过去七年中,基于机器学习的AI工具几乎完全自动化了地震学的基础任务——地震检测。AI模型能够检测到比人工分析师更小的地震,特别是在城市等嘈杂环境中。斯坦福团队开发的地震变换器等模型使用一维卷积和注意力机制,在包含120万个人工标记样本的数据集上训练。这些工具通常能发现比传统方法多10倍以上的地震,为火山结构成像和地质研究提供了更全面的地震目录。
腾讯混元团队联合北京大学提出MixGRPO技术,通过混合ODE-SDE采样策略和滑动窗口机制,将AI图像生成训练效率提升50%-71%,同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略,专注于图像生成早期阶段的重点优化,并引入高阶求解器进一步加速训练过程,为AI图像生成的产业化应用提供了更高效可行的解决方案。