OpenAI 推出全新 GPT-4.1 系列语言模型面向开发者

OpenAI 今天通过 API 向开发者推出三款新语言模型，其中旗舰 GPT-4.1 在编码效率上表现大幅提升，同时配套 mini 与 nano 模型以降低成本并实现低延迟，满足大规模数据处理需求。

OpenAI 今天通过其应用程序编程接口向开发者推出了三款全新语言模型。

该系列的旗舰算法 GPT-4.1 被描述为在编程方面比其前代产品“显著更优”。另外两款模型 GPT-4.1 mini 和 GPT-4.1 nano 则在一定程度上牺牲了部分输出质量，以换取更低的定价。这三款模型均可处理最多 1 million Token 的提示，使它们能够对大型上传内容（例如 GitHub 仓库）进行分析。

在开发者请求语言模型协助完成编码任务时，他们通常不会只发送一个提示，而是会发送多个提示。此外，提示内容往往引用先前的输入信息。OpenAI 表示，GPT-4 较其前作在“从对话中的过往消息中提取信息”这一能力上提升了 10.5% ，这使其在高级编程任务中更为实用。

与编程相关的提示通常包括一个代码文件及对其某些部分进行修改的指令。对于这类提示，OpenAI 早期的模型往往不仅输出要求变更的部分，还会返回原始代码文件中未做修改的部分。由于公司是按模型输出量向客户收费的，这就增加了成本。

据 OpenAI 介绍，其工程师已将 GPT-4.1 配置为仅输出发生改变的代码行，而非整个文件。为了进一步降低成本，用户还可对常用提示的答案进行缓存。作为此次产品更新的一部分，OpenAI 将缓存折扣从 50% 提升至 75%。

此外，OpenAI 表示 GPT-4.1 在其他方面也为开发者带来了一系列改进。该模型在生成用户界面方面表现更加出色，并且不易产生冗余代码，从而减少了软件团队在筛选模型输出时所需投入的时间。

今天推出的第二款新模型 GPT-4.1 mini 是一款在硬件效率上更优、但功能略逊一筹的算法。尽管如此，其性能与 GPT-4.1 的前身仍具竞争力。正如 OpenAI 工作人员在博客文章中描述的那样：“它在智力评估中达到了或超过 GPT-4o 的表现，同时将延迟减少了近一半，并且将成本降低了 83%。”

该公司语言模型阵容中的第三款产品是 GPT-4.1 nano。它专为相对简单的任务设计，例如根据主题对文档进行分类或支持编程工具中的代码自动完成功能。除了成本更低之外，它还承诺相比 OpenAI 推出的其他两款新模型具有显著更低的延迟。

OpenAI 工作人员写道：“我们改进了推理架构以缩短生成首个 Token 的时间，并且借助提示缓存，您可以在降低延迟的同时节省成本。在初步测试中，GPT-4.1 在包含 128000 Token 上下文条件下，其 p95 生成首个 Token 延迟约为 15 秒，而在包含 1000000 Token 上下文时延迟则可达半分钟左右。”

OpenAI 不计划将 GPT-4.1 应用于 ChatGPT，相反，公司选择优化早期用来支撑聊天机器人服务的 GPT-4o 模型在编码和指令跟随能力方面的表现。