OpenAI(即 ChatGPT 聊天机器人的开发公司)正在开发一个新的 AI 模型。根据 CEO Sam Altman 周一在推特上的透露,这将是一个具有推理能力的"开放权重"语言模型。
"开放权重" AI 模型是介于开源和闭源方法之间的一种中间形态。权重是 AI 模型学习和建立连接的方式——某些特征或连接会被赋予更高的权重,以强化特定信息。根据联邦贸易委员会的说法,开放权重模型意味着其权重是公开可用的。这表示用户可以查看这些权重并进行修改,而无需用新数据重新训练模型。
开放权重模型通常能降低企业的使用成本,并允许他们对模型进行定制。例如,企业可以将其内部文档上传到现有的开放权重模型中,在不必从头开始构建的情况下,将这些信息整合到模型的输出结果中。
但开放权重模型与开源模型并不相同。顾名思义,开源模型允许你查看其源代码组成,有时还包括其训练和权重分配方式。在开放权重模型中,你可以看到模型如何建立连接,但不一定能看到其底层代码或训练内容。这完全取决于开放程度。考虑到 OpenAI 一向不披露 ChatGPT 训练数据的做法,这个新的开放权重模型可能只会让人们稍微窥见其运作方式,而不会展示更多内容。
AI 公司正在激烈竞争,各自开发适用于不同用途的各类模型。OpenAI 的新模型有望成为 Meta 开源 Llama 模型的竞争对手。Mark Zuckerberg 多次表示,开源是 AI 发展的正确道路。新模型的推出也正值中国 AI 企业如 DeepSeek 争夺领先地位之际。据报道,DeepSeek 最新的 V3 模型目前处于领先地位,它也是一个开放权重模型。开放权重和开源模型可能会通过提供更便宜、更定制化的 AI 工具来威胁 OpenAI 的订阅模式,因此该公司似乎正在采取行动追赶竞争对手。
目前尚不清楚新模型具体何时发布。现在,OpenAI 正邀请开发者提交反馈,说明什么样的模型功能对他们最有用。你可以通过 OpenAI 网站上的表单提供反馈。
如需了解更多信息,可以查看使用 ChatGPT 新图像生成器制作的吉卜力风格 AI 图像,以及我们对该聊天机器人的完整评测。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。