前OpenAI高管米拉·穆拉蒂创立的初创公司Thinking Machines Lab,已与谷歌云签署了一项新的数十亿美元合作协议,旨在扩大其对谷歌云AI基础设施的使用,其中包括由英伟达最新GPU驱动的系统。TechCrunch独家获悉了上述消息。
据知情人士透露,此次协议价值为数十亿美元(个位数区间),涵盖访问基于英伟达最新GB300芯片构建的谷歌AI系统,以及支持模型训练和部署的基础设施服务。
谷歌目前正积极与众多AI开发商签署云计算合作协议,力求将其云服务与存储、Kubernetes引擎、以及其数据库产品Spanner等其他服务整合打通。本月早些时候,Anthropic已与谷歌和博通签署协议,获得多吉瓦级别的张量处理器(TPU)算力——这是谷歌专为机器学习工作负载定制设计的AI芯片。
然而市场竞争十分激烈。就在本周,Anthropic也与亚马逊签署了新协议,为Claude模型的训练与部署争取高达5吉瓦的算力资源。
今年早些时候,Thinking Machines曾与英伟达建立合作关系,并获得了这家芯片巨头的投资。而此次则是该实验室首度与云服务提供商达成合作。本次协议并非排他性的,因此Thinking Machines未来可能会同时使用多家云服务商,但这仍表明谷歌正致力于提前锁定快速成长中的前沿AI实验室。
穆拉蒂于2025年2月离开OpenAI首席技术官一职,随即创立了Thinking Machines。该公司成立后不久便完成了20亿美元的种子轮融资,估值达120亿美元。尽管公司行事一向低调神秘,但已于今年10月推出了首款产品Tinker——一款可自动化构建定制前沿AI模型的工具。
此次周三宣布的合作协议,也让外界对Thinking Machines的研发方向有了初步了解。谷歌在新闻稿中指出,谷歌云能够支持该初创公司的强化学习工作负载,而Tinker的底层架构正是依托强化学习构建的。强化学习是一种训练方法,近年来支撑了DeepMind、OpenAI等顶尖实验室的多项重大突破,而谷歌云合作规模之大,也折射出这类计算工作所需的极高算力成本。
Thinking Machines是首批获准访问谷歌GB300芯片驱动系统的谷歌云客户之一。据谷歌介绍,与上一代GPU相比,该系统在训练和推理速度方面提升了2倍。
Thinking Machines创始研究员迈尔·奥特在声明中表示:"谷歌云以我们所要求的稳定性,帮助我们实现了创纪录的运行速度。"
Q&A
Q1:Thinking Machines Lab是一家什么公司?
A:Thinking Machines Lab是由前OpenAI首席技术官米拉·穆拉蒂于2025年2月创立的AI初创公司,成立后不久即完成20亿美元种子轮融资,估值达120亿美元。公司行事低调,已于2025年10月推出首款产品Tinker,这是一款可自动化构建定制前沿AI模型的工具,底层依托强化学习技术构建。
Q2:谷歌与Thinking Machines Lab达成的这笔协议具体包含哪些内容?
A:此次合作协议价值数十亿美元(个位数区间),内容涵盖Thinking Machines访问基于英伟达最新GB300芯片构建的谷歌AI系统,以及获得模型训练和部署所需的基础设施服务支持。该协议并非排他性的,Thinking Machines未来可同时使用多家云服务商,Thinking Machines也是首批使用谷歌GB300系统的客户之一。
Q3:强化学习在AI模型训练中有什么重要性?
A:强化学习是一种通过不断试错和反馈来优化模型表现的训练方法,近年来支撑了DeepMind、OpenAI等顶尖AI实验室的多项重大技术突破。由于强化学习对算力的需求极高,Thinking Machines与谷歌云签署数十亿美元级别的协议,正是为了保障其Tinker产品所依赖的强化学习工作负载能够稳定高效地运行。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。