在生成式AI处理领域,合作伙伴之间存在大量的循环投资模式。大型云服务商拥有基础设施和资金,需要AI模型;而AI模型开发商拥有大规模运行的智能模型,但缺乏基础设施和资金。因此,云服务商向模型开发商提供现金并获得股份,同时获得模型访问权限,而这些现金又会在未来几年以容量租赁的形式回流。
这正是微软在2022年和2023年向OpenAI投资130亿美元,亚马逊向Anthropic投资40亿美元让其将Claude AI模型移植到AWS Trainium XPU并支付训练容量费用的原因。谷歌虽然是Anthropic的早期投资者(2022年底投资3亿美元),但公司又追加了30亿美元投资获得10%股份,Anthropic将使用这些资金在Google Cloud的GPU和TPU上训练模型。
有趣的是,谷歌的Gemini模型完全自给自足,仅在TPU上训练,并在应用程序和对外API中仅使用TPU进行推理。
据传,甲骨文刚刚签署了超过3000亿美元的协议,为OpenAI价值5000亿美元的大规模Stargate项目提供设备,这使甲骨文的估值在上周飙升。
CoreWeave是一家从加密货币挖矿转型的新云服务商,今年3月从OpenAI获得了159亿美元的未来GPU租赁订单,并正疯狂投资以实现这些容量上线。去年CoreWeave最大的客户是微软,我们认为大部分容量实际上是从Azure云卸载的OpenAI工作负载,因为Azure的GPU容量不足。
英伟达与CoreWeave的协议是这种模式的新变化。根据今天向美国证券交易委员会提交的8-K文件,该协议对CoreWeave在2032年到期前具有重大积极影响。
CoreWeave和英伟达在2023年4月签署了主服务协议,当时公司完成了2.21亿美元的B轮融资。随后在5月又获得2亿美元追加融资,12月完成6.42亿美元二次销售,2024年5月完成11亿美元C轮融资,10月又完成6.5亿美元二次销售。英伟达在此期间投入资金,据说持有CoreWeave 7%的股份。英伟达还以每股40美元的价格订购了2.5亿美元的股份,为CoreWeave的IPO提供支持。
CoreWeave目前市值接近588亿美元,这使英伟达的股份价值约41亿美元。英伟达在两年多时间里获得了18.6倍的投资回报。
更新后的主服务协议规定,到2032年,如果CoreWeave找不到客户,英伟达将保证63亿美元的GPU计算容量支出。这平均每年9亿美元,如果以GB200 NVL72实例租赁,按每个"Blackwell"GPU每小时10.50美元计算,相当于租赁9,387个GPU一年。
英伟达是全球最大的模型构建者和调优者之一,也在使用AI帮助芯片设计。租赁9,400个GPU一年可能会影响其预算,但考虑到英伟达从向所有人销售GPU集群获得的利润,这不会造成财务压力。这意味着英伟达可以以固定价格使用CoreWeave的闲置容量,而无需在其总部或其他设施增加更多硬件。
而且,英伟达可能需要在CoreWeave承担的全部容量中,超过一半已经被CoreWeave股票的增值所覆盖。实际上,我们认为英伟达不需要支付很多容量费用,除非生成式AI热潮完全崩溃。
Q&A
Q1:英伟达与CoreWeave签署了什么样的协议?
A:英伟达与CoreWeave签署了一项到2032年到期的主服务协议,英伟达将保证63亿美元的GPU计算容量支出,如果CoreWeave找不到客户,英伟达将承担这些容量。这平均每年约9亿美元,相当于租赁约9,400个GPU一年的容量。
Q2:为什么英伟达要为CoreWeave提供这种担保?
A:英伟达持有CoreWeave 7%的股份,价值约41亿美元,已获得18.6倍投资回报。英伟达将CoreWeave视为对抗AWS、微软和谷歌的平衡力量。通过这种担保,英伟达可以使用CoreWeave的闲置容量而无需自建更多基础设施。
Q3:CoreWeave是什么公司?主要业务是什么?
A:CoreWeave是一家从加密货币挖矿转型的新兴云服务商,目前市值接近588亿美元。公司今年3月从OpenAI获得了159亿美元的未来GPU租赁订单,去年最大客户是微软,主要承接从Azure云卸载的OpenAI工作负载。
好文章,需要你的鼓励
33年后,贝尔纳多·金特罗决定寻找改变他人生的那个人——创造马拉加病毒的匿名程序员。这个相对无害的病毒激发了金特罗对网络安全的热情,促使他创立了VirusTotal公司,该公司于2012年被谷歌收购。这次收购将谷歌的欧洲网络安全中心带到了马拉加,使这座西班牙城市转变为科技中心。通过深入研究病毒代码和媒体寻人,金特罗最终发现病毒创造者是已故的安东尼奥·恩里克·阿斯托尔加。
这项由多伦多大学领导的研究首次系统性地揭示了分词器选择对语言模型性能的重大影响。通过训练14个仅在分词器上有差异的相同模型,并使用包含5000个现实场景测试样本的基准测试,研究发现分词器的算法设计比词汇表大小更重要,字符级处理虽然效率较低但稳定性更强,而Unicode格式化是所有分词器的普遍弱点。这一发现将推动AI系统基础组件的优化发展。
人工智能安全公司Cyata发现LangChain核心库存在严重漏洞"LangGrinch",CVE编号为2025-68664,CVSS评分达9.3分。该漏洞可导致攻击者窃取敏感机密信息,甚至可能升级为远程代码执行。LangChain核心库下载量约8.47亿次,是AI智能体生态系统的基础组件。漏洞源于序列化和反序列化注入问题,可通过提示注入触发。目前补丁已发布,建议立即更新至1.2.5或0.3.81版本。
北京大学研究团队提出NExT-Vid方法,首次将自回归下一帧预测引入视频AI预训练。通过创新的上下文隔离设计和流匹配解码器,让机器像人类一样预测视频下一帧来学习理解视频内容。该方法在四个标准数据集上全面超越现有生成式预训练方法,为视频推荐、智能监控、医疗诊断等应用提供了新的技术基础。