AI初创公司Thinking Machines Lab(TML)正在大规模扩张,而这背后的重要推动力之一,正是来自Meta的持续人才输送。
王伟耀(Weiyao Wang)在Meta工作了八年,这是他大学毕业后的第一份工作。在此期间,他参与构建了多模态感知系统,并为SAM3D等开放世界分割项目作出了贡献。上周,他正式结束了在Meta的职业生涯,随即加入Thinking Machines Lab。
与此同时,TML在业务层面也迎来重大进展。该公司刚刚与谷歌签署了一项价值数十亿美元的云计算合作协议,由此获得了英伟达最新款GB300芯片的使用权,成为首批在该硬件上运行的初创公司之一。这一协议于本周二的Google Cloud Next大会上正式公布,此前TML已与英伟达建立了合作关系,此次新协议使其基础设施规模跻身Anthropic和Meta同等级别。(据报道,Meta约在一年前曾与TML探讨过收购事宜,近期又陆续将TML的多位创始人挖走。)
人才流动态势目前仍在持续演变。王伟耀与Kenneth Li——一位在Meta工作了10个月后于本月转投TML的哈佛博士——是这场双向人才争夺战的最新案例。据Business Insider上周报道,Meta已从TML挖走了七名创始成员。而对近期招聘情况的梳理则显示,TML也在同步反向挖角Meta。通过对LinkedIn主页的分析可以发现,TML从Meta招募的研究人员数量,多于其他任何一家单一雇主。
其中最具代表性的人物是TML首席技术官Soumith Chintala。他在Meta工作了11年,是开源深度学习框架PyTorch的联合创始人——这一框架目前支撑着全球绝大多数AI研究。他于2025年底离开Meta,并于今年初正式出任TML的首席技术官。另一位在Meta工作了11年的研究主管Piotr Dollár,曾参与撰写极具影响力的Segment Anything模型论文,目前已进入TML技术团队。专注于多模态大语言模型研究的Meta FAIR部门研究科学家Andrea Madotto,于去年12月加入TML。在Meta从事大语言模型预训练与后训练工作近九年的软件工程师James Sun,也完成了这一职业跳转。
TML吸引的人才并不仅限于Meta。曾三次荣获国际信息学奥林匹克竞赛金牌、同时也是备受关注的编程初创公司Cognition创始成员之一的Neal Wu,于今年初加入TML。Jeffrey Tao此前曾先后效力于Waymo、Windsurf和OpenAI。Muhammad Maaz曾在Anthropic担任研究员职务。Erik Wijmans来自苹果公司。Liliang Ren在加入TML之前,曾在微软AI超级智能团队从事大语言模型代码预训练工作长达两年半,于今年3月正式加入。
目前,TML的员工总数约为140人。
Meta提供的薪酬方案向来以高薪且附加条件少著称,数字往往高达七位数。对于正在权衡职业选择的研究人员而言,这道算术题或许并不复杂:Thinking Machines Lab目前估值已达120亿美元。尽管这一数字放在以往任何一个科技周期都难以想象(该公司目前仅发布了一款产品),但与OpenAI和Anthropic创纪录的估值相比,TML仍拥有相当可观的财务增长空间。
截至周五上午,TML方面发言人拒绝就此事置评。
Q&A
Q1:Thinking Machines Lab与谷歌签订的云计算协议具体包含哪些内容?
A:TML与谷歌签署了一项价值数十亿美元的云计算合作协议,获得了英伟达最新款GB300芯片的使用权,成为首批在该硬件上运行的初创公司之一。这一协议在Google Cloud Next大会上正式公布,使TML的基础设施规模跻身与Anthropic和Meta同等的级别。
Q2:Soumith Chintala为什么会从Meta跳槽到Thinking Machines Lab?
A:目前公开信息未透露Soumith Chintala离职的具体原因。他在Meta工作了11年,是PyTorch框架的联合创始人,于2025年底离开Meta后,于今年初出任TML首席技术官。TML目前估值达120亿美元,对顶尖研究人员具有较强的财务吸引力,这可能是其职业选择的重要考量之一。
Q3:Thinking Machines Lab目前的规模和估值是多少?
A:TML目前员工总数约为140人,公司估值达120亿美元。尽管该公司目前仅发布了一款产品,但其估值在初创公司中已属极高水平。与OpenAI和Anthropic等头部公司相比,TML被认为仍存在较大的财务增长空间。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。