OpenAI正式发布GPT-5.4模型,这是该公司最新版本的AI模型,据称在推理、编程以及涉及电子表格、文档和演示文稿的专业工作方面实现了重大突破。这也是OpenAI首个具备原生计算机使用能力的模型,能够代表用户操作计算机并跨不同应用程序完成任务。
新模型标志着AI公司正朝着智能体化未来迈进,在这个未来中,AI驱动的智能体网络将在后台运行,完成复杂的在线任务和软件操作。OpenAI在去年推出了ChatGPT智能体,这是众多智能体工具中的一个,可以控制你的计算机执行任务,比如搜索并购买烹饪食材。
虽然OpenAI正将GPT-5.4引入其API和AI驱动的编程工具Codex,但它同时推出了推理模型GPT-5.4 Thinking到ChatGPT中。OpenAI表示,GPT-5.4可以编写代码来操作计算机,并能够响应屏幕截图发出键盘和鼠标命令。GPT-5.4在使用网络浏览器方面也有所改进,在调用工具和API方面更加准确和高效。
该模型在处理需要从多个来源收集信息的问题方面表现更佳,OpenAI称该模型"可以更持久地进行多轮搜索,识别最相关的来源,特别是对于'大海捞针'类型的问题,并将它们综合成清晰、合理的答案。"OpenAI声称GPT-5.4是其"迄今为止最真实的模型",与GPT-5.2相比,个别声明的错误率降低了33%。
在ChatGPT中,GPT-5.4 Thinking将为复杂查询提供工作大纲,同时允许用户在响应过程中调整或更改他们的请求。"这使得引导模型达到您想要的确切结果变得更容易,无需重新开始或需要多次额外交互,"OpenAI表示。该功能现已在ChatGPT网页应用和Android版本中提供,但OpenAI表示iOS应用"即将推出"。
GPT-5.4正在ChatGPT、Codex和API中推出,GPT-5.4 Thinking模型将面向Plus、团队和专业用户推出。还有一个GPT-5.4 Pro模型专为"复杂任务的最大性能"而设计,正在API以及ChatGPT企业版和教育版中推出。
Q&A
Q1:GPT-5.4模型有什么新功能?
A:GPT-5.4是OpenAI首个具备原生计算机使用能力的模型,能够代表用户操作计算机并跨不同应用程序完成任务。它在推理、编程以及涉及电子表格、文档和演示文稿的专业工作方面实现了重大突破,还可以编写代码来操作计算机,发出键盘和鼠标命令。
Q2:GPT-5.4与之前的模型相比有哪些改进?
A:与GPT-5.2相比,GPT-5.4在准确性方面有显著提升,个别声明的错误率降低了33%。它在使用网络浏览器方面也有所改进,在调用工具和API方面更加准确和高效,能够更持久地进行多轮搜索,特别适合处理"大海捞针"类型的复杂问题。
Q3:如何使用GPT-5.4模型?
A:GPT-5.4正在ChatGPT、Codex和API中推出。GPT-5.4 Thinking模型面向ChatGPT的Plus、团队和专业用户开放。还有GPT-5.4 Pro模型专为复杂任务设计,在API以及ChatGPT企业版和教育版中提供。该功能现已在网页应用和Android版本中可用,iOS应用即将推出。
好文章,需要你的鼓励
今天讲的出海案例是依米康,这家数据中心温控与液冷设备厂商正在把泰国纳入海外交付体系,并用生产线、总装车间和焓差实验室承接算力设施订单。
BioMatrix是首个将分子序列、分子三维结构、蛋白质序列、蛋白质三维结构和自然语言统一在单一语言模型中的生物基础模型,在80项任务中77项达到最优或第二优。
Salesforce正式推出Help Agent,这是基于Agentforce平台的预封装AI客服智能体,可在数分钟内连接企业知识库、操作功能及网页、短信、语音等沟通渠道。该产品同步推出按解决率计费模式,每次成功自主解决客户问题收费2美元,无需按token或操作次数计费。Help Agent支持低代码构建,内置测试功能,并配备全新客户服务门户。该产品预计于2026年7月正式上线。
浙江大学提出SKILLHARNESS框架,通过为AI电脑助手的每项技能附加安全边界,从成功、失败和风险三类经历中学习,使AI在动态危险环境中安全高效地完成任务。