亚马逊大幅加码对Claude开发商Anthropic的押注,追加50亿美元投资,使Anthropic最终能够从亚马逊采购相当于5吉瓦算力的AI芯片,用于训练和运行其广受欢迎的Claude系列AI模型。
亚马逊此前已向这家AI初创公司投资80亿美元,是Anthropic最大投资方之一。据《华尔街日报》报道,此次追加投资后,亚马逊的即时投资总额已升至130亿美元。此外,双方还达成协议:若合作关系达成特定商业里程碑,亚马逊未来还可能再追加200亿美元投资。
对于Anthropic而言,此番大规模资金注入以及获得更多算力资源的前景,恰逢关键时刻——今年年初,Claude相关服务的付费订阅用户数量出现爆发式增长。这波需求激增以及现有云计算基础设施所承受的压力,已导致数以千计的Claude用户遭遇性能下降甚至偶发性服务中断等问题。
Anthropic在随亚马逊投资公告发布的声明中写道:"如此迅猛的增长对我们的基础设施造成了不可避免的压力;尤其是消费端的空前增长,在流量高峰期间影响了免费版、Pro版、Max版和Team版用户的服务可靠性与使用体验。"
Anthropic表示,与亚马逊达成的新协议将在未来三个月内提供"可观的算力资源",并在2026年底前实现总计近1吉瓦的算力规模。至于何时能够完全落实从亚马逊获取5吉瓦新增算力的目标,Anthropic目前尚未披露具体时间表。
此次协议所涵盖的芯片范围,包括亚马逊的Graviton处理器,以及从Trainium2到Trainium4的多个世代AI芯片。其中,Trainium系列芯片是亚马逊专为数据中心训练大规模AI模型而设计的自研AI芯片。
亚马逊首席执行官安迪·贾西在随公告发布的声明中表示:"我们的定制AI芯片能够以显著更低的成本为客户提供高性能服务,这正是其供不应求的原因。"
这项协议也是AI热潮中"循环融资"模式的最新典型案例——即科技巨头向AI初创公司投资,后者再将资金用于购买原始投资方的产品或服务。在此次合作中,亚马逊向Anthropic注入更多资金,而Anthropic则将用这笔资金向亚马逊采购更多AI芯片和云计算资源。根据最新协议,Anthropic承诺在未来十年内向亚马逊云科技(AWS)的技术投入超过1000亿美元,涵盖亚马逊现有及未来各世代的定制芯片。
对于Anthropic来说,涉及各大科技巨头的"循环融资"并非仅此一例。这家AI初创公司在分别获得谷歌、英伟达和微软的数十亿美元投资后,也向这三家公司采购了AI芯片和云服务——这是其多云战略的重要组成部分,使Anthropic得以广泛获取各类最新AI硬件资源。
Q&A
Q1:亚马逊为什么要向Anthropic追加投资?
A:亚马逊追加投资Anthropic,一方面是为了加深与这家Claude开发商的战略合作关系,另一方面也是"循环融资"模式的体现——Anthropic将用这笔资金向亚马逊采购AI芯片和云计算资源。此外,Anthropic承诺未来十年向AWS投入超过1000亿美元,进一步巩固了双方的深度绑定关系。
Q2:Anthropic的Claude为什么会出现服务中断?
A:今年年初,Claude相关服务的付费订阅用户数量出现爆发式增长,现有云计算基础设施难以支撑突如其来的庞大需求,导致数千名用户在流量高峰期间遭遇性能下降甚至服务中断。Anthropic表示,此次获得的新增算力资源将有助于缓解这一问题。
Q3:亚马逊为Anthropic提供的是哪些芯片?
A:根据协议,亚马逊将为Anthropic提供Graviton处理器以及Trainium2至Trainium4多个世代的AI芯片。其中Trainium系列是亚马逊专为数据中心训练大规模AI模型设计的自研芯片,亚马逊方面表示这类芯片能以更低成本提供高性能算力。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。