OpenAI 今天通过其应用程序编程接口向开发者推出了三款全新语言模型。
该系列的旗舰算法 GPT-4.1 被描述为在编程方面比其前代产品“显著更优”。另外两款模型 GPT-4.1 mini 和 GPT-4.1 nano 则在一定程度上牺牲了部分输出质量,以换取更低的定价。这三款模型均可处理最多 1 million Token 的提示,使它们能够对大型上传内容(例如 GitHub 仓库)进行分析。
在开发者请求语言模型协助完成编码任务时,他们通常不会只发送一个提示,而是会发送多个提示。此外,提示内容往往引用先前的输入信息。OpenAI 表示,GPT-4 较其前作在“从对话中的过往消息中提取信息”这一能力上提升了 10.5% ,这使其在高级编程任务中更为实用。
与编程相关的提示通常包括一个代码文件及对其某些部分进行修改的指令。对于这类提示,OpenAI 早期的模型往往不仅输出要求变更的部分,还会返回原始代码文件中未做修改的部分。由于公司是按模型输出量向客户收费的,这就增加了成本。
据 OpenAI 介绍,其工程师已将 GPT-4.1 配置为仅输出发生改变的代码行,而非整个文件。为了进一步降低成本,用户还可对常用提示的答案进行缓存。作为此次产品更新的一部分,OpenAI 将缓存折扣从 50% 提升至 75%。
此外,OpenAI 表示 GPT-4.1 在其他方面也为开发者带来了一系列改进。该模型在生成用户界面方面表现更加出色,并且不易产生冗余代码,从而减少了软件团队在筛选模型输出时所需投入的时间。
今天推出的第二款新模型 GPT-4.1 mini 是一款在硬件效率上更优、但功能略逊一筹的算法。尽管如此,其性能与 GPT-4.1 的前身仍具竞争力。正如 OpenAI 工作人员在博客文章中描述的那样:“它在智力评估中达到了或超过 GPT-4o 的表现,同时将延迟减少了近一半,并且将成本降低了 83%。”
该公司语言模型阵容中的第三款产品是 GPT-4.1 nano。它专为相对简单的任务设计,例如根据主题对文档进行分类或支持编程工具中的代码自动完成功能。除了成本更低之外,它还承诺相比 OpenAI 推出的其他两款新模型具有显著更低的延迟。
OpenAI 工作人员写道:“我们改进了推理架构以缩短生成首个 Token 的时间,并且借助提示缓存,您可以在降低延迟的同时节省成本。在初步测试中,GPT-4.1 在包含 128000 Token 上下文条件下,其 p95 生成首个 Token 延迟约为 15 秒,而在包含 1000000 Token 上下文时延迟则可达半分钟左右。”
OpenAI 不计划将 GPT-4.1 应用于 ChatGPT,相反,公司选择优化早期用来支撑聊天机器人服务的 GPT-4o 模型在编码和指令跟随能力方面的表现。
好文章,需要你的鼓励
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。