前 OpenAI 首席技术官 Mira Murati 今日宣布成立一家新的人工智能初创公司 Thinking Machines Lab Inc.,该公司将专注于开发多模态模型。
据路透社此前报道,Murati 正在为新企业寻求超过 1 亿美元的融资,该公司在今天发布的创立博文中并未对融资消息做出回应。不过,公司确认了另一个此前报道的细节:前 OpenAI 研究主管 Barret Zoph 已加入初创团队。
Murati 和 Zoph 于去年 9 月离开 OpenAI,此前 ChatGPT 开发商的联合创始人之一 John Schulman 也已卸任。在 Thinking Machines Lab,Murati 担任首席执行官,Zoph 担任首席技术官,而 Schulman 则担任首席研究官。
Thinking Machines Lab 计划训练能够处理文本和图像等多媒体文件的多模态模型。作为 OpenAI 的首席技术官,Murati 曾主导开发 ChatGPT 和图像生成模型 DALL-E。她还在促成 OpenAI 与 Microsoft 的合作关系中发挥了关键作用,Microsoft 为 AI 开发商的研究提供了大量云计算基础设施支持。
该初创公司在创立博文中表示,将"把基础设施质量作为首要任务"。"研究生产力至关重要,它在很大程度上依赖于基础设施的可靠性、效率和易用性。我们的目标是为长远发展正确构建这些基础。"
公司还分享了其发展路线图的其他细节。与 OpenAI 的 o1 不同,其模型不会专门针对编程和数学任务,而是将具备"适应人类专业知识全谱系的能力,并支持更广泛的应用"。目前尚不清楚这些应用是否会包括消费者使用场景。
可定制性将是 Thinking Machines Lab 工程开发的另一个重点。公司计划让客户能够轻松地根据需求定制其 AI 模型。目前,企业主要通过提示词和在专有训练数据集上进行微调来定制神经网络。
去年有报道称,Thinking Machines Lab 的产品将基于专有模型。不过,该公司似乎计划开源其 AI 技术栈的部分组件。
公司在其网站上表示:"我们相信,通过与更广泛的研究人员和开发者社区合作,我们将更有效地推进人类对 AI 的理解。我们计划经常发布技术博客文章、论文和代码。"
开源计划还将包括 AI 安全等方面。公司计划公开发布在避免有害 AI 输出过程中产生的代码和其他技术资产。公司打算使用红队测试等成熟方法来测试其算法的安全性,即通过模拟网络攻击来发现弱点。
Thinking Machines Lab 目前拥有 29 名员工。除了前 OpenAI 员工外,初始团队还包括来自 Google LLC、Meta Platforms Inc.、Mistral 等 AI 生态系统主要企业的研究人员。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。