OpenAI发布GPT-5.4大语言模型，增强计算机视觉和工具使用能力

OpenAI今日推出新一代大语言模型GPT-5.4，在自动化工作任务方面表现更优。新模型显著减少token使用量，降低推理成本，并支持自动工具搜索功能。GPT-5.4可处理多达100万token的请求，图像处理能力大幅提升，支持超过1000万像素图片无损上传。在计算机使用基准测试中创下75%的行业记录。

OpenAI集团今日发布了一款新的大语言模型，该公司表示这款模型在自动化工作任务方面比早期算法更加熟练。

GPT-5.4现已在ChatGPT、Codex编程工具和OpenAI的应用程序编程接口中提供。

该公司根据其大语言模型在生成提示响应时处理的Token数量向API用户收费。Token是由几个字母或字符组成的数据单位。OpenAI表示，GPT-5.4使用的Token比12月发布的GPT-5.2"显著"减少。减少模型的Token使用量可以降低推理计算成本。

OpenAI表示，其新模型还可以通过其他方式降低客户的推理费用。

基于OpenAI API构建的应用程序通常依赖外部程序或工具来完成任务。在此之前，开发者必须准备其应用程序使用的工具的详细列表，并将其包含在API请求中。工具列表可能会使API请求的大小增加数千个Token，从而推高推理成本。

GPT-5.4使这一工作流程更加高效。据OpenAI称，一个新的搜索引擎使模型能够自动找到应用程序执行给定任务所需的工具。这避免了上传详细工具列表的需要，从而减少了提示大小和推理成本。

新模型可以处理多达100万个Token的请求。与前代产品相比，该模型在处理包含图像的提示方面表现显著更好。开发者可以上传包含超过1000万像素的图像而无需压缩，这防止了潜在重要细节的丢失。

升级的视觉能力使GPT-5.4在计算机使用方面更加熟练，即通过用户界面与应用程序交互的任务。OpenAI使用名为OSWorld-Verified的流行计算机使用基准测试对该模型进行了评估。它以75%的分数创下行业记录，高于GPT-5.2的结果和人类测试者通常达到的72.4%。

该模型在其他领域也超越了前代产品。GPT-5.4在OpenAI创建的电子表格分析基准测试中获得了87.3%的平均分数，比GPT-5.2提高了8%以上。新模型在准备演示文稿、使用浏览器进行在线研究和回答科学问题方面也表现更佳。

GPT-5.4通过OpenAI的API提供，价格为每百万输入Token 2.5美元，每百万输出Token 12美元。有高级需求的用户可以访问模型的增强版本GPT-5.4 Pro，OpenAI表示该版本旨在为"复杂任务提供最大性能"。增强版本也与标准版本一起在ChatGPT中提供。

Q&A

Q1：GPT-5.4相比GPT-5.2有哪些主要改进？

A：GPT-5.4在多个方面都有显著改进：首先是Token使用量大幅减少，降低了推理计算成本；其次是视觉处理能力大幅提升，可以处理超过1000万像素的图像而无需压缩；第三是新增自动工具搜索功能，避免了手动上传详细工具列表的需要；最后在各项基准测试中表现更优，包括计算机使用、电子表格分析等任务。

Q2：GPT-5.4的定价策略是怎样的？

A：GPT-5.4通过OpenAI的API提供服务，标准版本的价格为每百万输入Token 2.5美元，每百万输出Token 12美元。对于有高级需求的用户，OpenAI还提供增强版本GPT-5.4 Pro，专为复杂任务设计以提供最大性能。该增强版本同时在ChatGPT和API中提供。

Q3：GPT-5.4在计算机使用能力方面表现如何？

A：GPT-5.4在计算机使用能力方面表现卓越，在OSWorld-Verified基准测试中获得75%的分数，创下行业新纪录。这一成绩不仅超越了前代GPT-5.2，还高于人类测试者通常达到的72.4%。这意味着GPT-5.4在通过用户界面与应用程序交互方面已经达到甚至超越了人类水平。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

OpenAI发布GPT-5.4大语言模型，增强计算机视觉和工具使用能力

来源：SiliconANGLE

2026

03/06

17:47

分享

点赞

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

Cellebrite携手SkySafe，打造无人机数字取证一体化平台

人类意识研究者：对AI可能有意识的说法持怀疑态度

帮助AI模型走向现实世界的企业预测决策技术

AI重写软件代码引发许可证争议 开源生态面临颠覆性挑战

OpenAI发布GPT-5.4模型，朝自主智能体迈出重要一步

DiligenceSquared利用AI语音智能体降低并购研究成本

谷歌API密钥安全漏洞暴露Gemini AI私人数据

数据中心智能电网储能系统缓解AI负载波动新技术

数据中心设计因AI需求激增出现结构性变革

英国高管将决策权大量外包给AI系统

Lightrun推出AI SRE助手自动发现修复生产环境软件错误

昆虫学家利用粒子加速器大规模成像蚂蚁

Dyna.Ai获八位数A轮融资，推动智能体AI在金融服务业落地应用

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

AI重写软件代码引发许可证争议开源生态面临颠覆性挑战