前 OpenAI 首席技术官 Mira Murati 今日宣布成立一家新的人工智能初创公司 Thinking Machines Lab Inc.,该公司将专注于开发多模态模型。
据路透社此前报道,Murati 正在为新企业寻求超过 1 亿美元的融资,该公司在今天发布的创立博文中并未对融资消息做出回应。不过,公司确认了另一个此前报道的细节:前 OpenAI 研究主管 Barret Zoph 已加入初创团队。
Murati 和 Zoph 于去年 9 月离开 OpenAI,此前 ChatGPT 开发商的联合创始人之一 John Schulman 也已卸任。在 Thinking Machines Lab,Murati 担任首席执行官,Zoph 担任首席技术官,而 Schulman 则担任首席研究官。
Thinking Machines Lab 计划训练能够处理文本和图像等多媒体文件的多模态模型。作为 OpenAI 的首席技术官,Murati 曾主导开发 ChatGPT 和图像生成模型 DALL-E。她还在促成 OpenAI 与 Microsoft 的合作关系中发挥了关键作用,Microsoft 为 AI 开发商的研究提供了大量云计算基础设施支持。
该初创公司在创立博文中表示,将"把基础设施质量作为首要任务"。"研究生产力至关重要,它在很大程度上依赖于基础设施的可靠性、效率和易用性。我们的目标是为长远发展正确构建这些基础。"
公司还分享了其发展路线图的其他细节。与 OpenAI 的 o1 不同,其模型不会专门针对编程和数学任务,而是将具备"适应人类专业知识全谱系的能力,并支持更广泛的应用"。目前尚不清楚这些应用是否会包括消费者使用场景。
可定制性将是 Thinking Machines Lab 工程开发的另一个重点。公司计划让客户能够轻松地根据需求定制其 AI 模型。目前,企业主要通过提示词和在专有训练数据集上进行微调来定制神经网络。
去年有报道称,Thinking Machines Lab 的产品将基于专有模型。不过,该公司似乎计划开源其 AI 技术栈的部分组件。
公司在其网站上表示:"我们相信,通过与更广泛的研究人员和开发者社区合作,我们将更有效地推进人类对 AI 的理解。我们计划经常发布技术博客文章、论文和代码。"
开源计划还将包括 AI 安全等方面。公司计划公开发布在避免有害 AI 输出过程中产生的代码和其他技术资产。公司打算使用红队测试等成熟方法来测试其算法的安全性,即通过模拟网络攻击来发现弱点。
Thinking Machines Lab 目前拥有 29 名员工。除了前 OpenAI 员工外,初始团队还包括来自 Google LLC、Meta Platforms Inc.、Mistral 等 AI 生态系统主要企业的研究人员。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。