在生成式AI处理领域,合作伙伴之间存在大量的循环投资模式。大型云服务商拥有基础设施和资金,需要AI模型;而AI模型开发商拥有大规模运行的智能模型,但缺乏基础设施和资金。因此,云服务商向模型开发商提供现金并获得股份,同时获得模型访问权限,而这些现金又会在未来几年以容量租赁的形式回流。
这正是微软在2022年和2023年向OpenAI投资130亿美元,亚马逊向Anthropic投资40亿美元让其将Claude AI模型移植到AWS Trainium XPU并支付训练容量费用的原因。谷歌虽然是Anthropic的早期投资者(2022年底投资3亿美元),但公司又追加了30亿美元投资获得10%股份,Anthropic将使用这些资金在Google Cloud的GPU和TPU上训练模型。
有趣的是,谷歌的Gemini模型完全自给自足,仅在TPU上训练,并在应用程序和对外API中仅使用TPU进行推理。
据传,甲骨文刚刚签署了超过3000亿美元的协议,为OpenAI价值5000亿美元的大规模Stargate项目提供设备,这使甲骨文的估值在上周飙升。
CoreWeave是一家从加密货币挖矿转型的新云服务商,今年3月从OpenAI获得了159亿美元的未来GPU租赁订单,并正疯狂投资以实现这些容量上线。去年CoreWeave最大的客户是微软,我们认为大部分容量实际上是从Azure云卸载的OpenAI工作负载,因为Azure的GPU容量不足。
英伟达与CoreWeave的协议是这种模式的新变化。根据今天向美国证券交易委员会提交的8-K文件,该协议对CoreWeave在2032年到期前具有重大积极影响。
CoreWeave和英伟达在2023年4月签署了主服务协议,当时公司完成了2.21亿美元的B轮融资。随后在5月又获得2亿美元追加融资,12月完成6.42亿美元二次销售,2024年5月完成11亿美元C轮融资,10月又完成6.5亿美元二次销售。英伟达在此期间投入资金,据说持有CoreWeave 7%的股份。英伟达还以每股40美元的价格订购了2.5亿美元的股份,为CoreWeave的IPO提供支持。
CoreWeave目前市值接近588亿美元,这使英伟达的股份价值约41亿美元。英伟达在两年多时间里获得了18.6倍的投资回报。
更新后的主服务协议规定,到2032年,如果CoreWeave找不到客户,英伟达将保证63亿美元的GPU计算容量支出。这平均每年9亿美元,如果以GB200 NVL72实例租赁,按每个"Blackwell"GPU每小时10.50美元计算,相当于租赁9,387个GPU一年。
英伟达是全球最大的模型构建者和调优者之一,也在使用AI帮助芯片设计。租赁9,400个GPU一年可能会影响其预算,但考虑到英伟达从向所有人销售GPU集群获得的利润,这不会造成财务压力。这意味着英伟达可以以固定价格使用CoreWeave的闲置容量,而无需在其总部或其他设施增加更多硬件。
而且,英伟达可能需要在CoreWeave承担的全部容量中,超过一半已经被CoreWeave股票的增值所覆盖。实际上,我们认为英伟达不需要支付很多容量费用,除非生成式AI热潮完全崩溃。
Q&A
Q1:英伟达与CoreWeave签署了什么样的协议?
A:英伟达与CoreWeave签署了一项到2032年到期的主服务协议,英伟达将保证63亿美元的GPU计算容量支出,如果CoreWeave找不到客户,英伟达将承担这些容量。这平均每年约9亿美元,相当于租赁约9,400个GPU一年的容量。
Q2:为什么英伟达要为CoreWeave提供这种担保?
A:英伟达持有CoreWeave 7%的股份,价值约41亿美元,已获得18.6倍投资回报。英伟达将CoreWeave视为对抗AWS、微软和谷歌的平衡力量。通过这种担保,英伟达可以使用CoreWeave的闲置容量而无需自建更多基础设施。
Q3:CoreWeave是什么公司?主要业务是什么?
A:CoreWeave是一家从加密货币挖矿转型的新兴云服务商,目前市值接近588亿美元。公司今年3月从OpenAI获得了159亿美元的未来GPU租赁订单,去年最大客户是微软,主要承接从Azure云卸载的OpenAI工作负载。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。