ChatGPT Images 2发布：OpenAI关闭Sora后为何重返图像领域

OpenAI正式发布新一代图像生成模型ChatGPT Images 2，主打文字密集型图像创作，涵盖信息图表、科学海报、学习指南及营销素材等场景。新模型在排版、图标设计和构图方面均有提升，支持多语言文字渲染，并向API开发者开放2K和4K分辨率生成功能。此举标志着OpenAI正将生成式媒体能力聚焦于"具备经济价值的创意任务"，进一步完善其超级应用布局。

自OpenAI发布ChatGPT Images 1.5以来，短短四个月间，AI行业已发生了翻天覆地的变化。智能体工具的激烈竞赛、与五角大楼签订的史无前例的合作协议，以及泛滥成灾的AI垃圾内容，构成了这一时期的行业底色。

如今，OpenAI再次强势进入生成式AI媒体领域。该公司于周二宣布推出ChatGPT Images 2，这是其新一代图像生成模型。

就在一个月前，OpenAI刚刚宣布关闭曾经风靡一时的Sora AI视频应用，理由是要专注于构建面向企业的"核心产品"。在这一背景下，推出新图像模型似乎令人费解。但从新模型的设计思路来看，OpenAI并未偏离既定目标。

ChatGPT Images 2专为生成富含文字的图像而设计，涵盖信息图表、科学海报、学习指南和营销素材等多种应用场景。那些奇异的Sora视频和吉卜力风格的表情包时代，已然落幕。

OpenAI目前的方向，是打造能够完成其所称的"具有经济价值的创意任务"的AI工具。

ChatGPT图像产品负责人Adele Li在新闻发布会上表示："视觉智能的适用范围和使用场景正在极大地拓展，我们相信这对于ChatGPT打造个人专属助手的愿景至关重要——因为创意助手是每个人个性的重要组成部分。"

（披露信息：CNET母公司Ziff Davis已于2025年4月对OpenAI提起诉讼，指控其在训练和运营AI系统过程中侵犯了Ziff Davis的版权。）

OpenAI一直致力于打造一款超级应用——基于Codex平台构建的AI全能一站式平台。ChatGPT Images 2正是为这一愿景补全了创意拼图。

新模型在排版、图标设计和构图方面均有显著提升，能够生成更具专业质感的AI图像，并支持多语言文字生成。长期以来，AI图像模型在生成清晰、准确的文字方面饱受诟病。ChatGPT Images 2是OpenAI迄今在这一领域表现最佳的模型。谷歌此前通过Nano Banana Pro改进了文本渲染能力，但即便是其"顶尖"模型，在准确性方面仍存在一定不足。

ChatGPT Images 2目前已向所有用户开放。可生成的图像数量取决于所选套餐，付费金额越高，可生成的AI图像数量越多。

通过API调用模型的开发者可生成2K和4K分辨率的图像，但这两种高分辨率模式目前仍处于测试阶段，可能存在不稳定情况。付费用户还可结合思维推理模型使用该功能——这些模型能够在网络上检索信息，将其整合为可读的视觉设计，并对结果进行自动校验。

"图像模型"这一描述对ChatGPT Images 2而言似乎并不完全贴切，尽管从技术定义上确实如此。它既无法像Midjourney那样呈现天马行空的超现实主义画风，也不具备Adobe Firefly那般丰富的编辑工具。

但它精准地服务于介于Midjourney艺术创作爱好者与Adobe专业设计师之间的用户群体——那些需要快速生成有吸引力内容的普通用户。

与Anthropic近期发布的Claude Design类似，OpenAI的ChatGPT Images 2同样面向职场专业人士。教师可用它制作学习指南和图文并茂的教案，营销经理可用它生成社交媒体帖子和视觉素材。

用户可以从单个提示词生成最多八张图像，例如一份三页的报告，且所有图像在视觉风格上保持统一。

该模型存在一个不足之处：若需调整AI生成的图像，仍需重新生成。对于文字内容较多的设计，这种情况出现的概率更高，因此用户的生成额度消耗也会更快。OpenAI表示，其重点在于维持基于提示词迭代编辑的操作流程，以保持使用的便捷性。

在安全机制方面，OpenAI与上一版图像模型相比并无重大变化，仍通过C2PA标准在图像中嵌入元数据，以便识别AI生成图像的来源。滥用性和违法图像依然在OpenAI的使用政策中被明令禁止——鉴于近期AI深度伪造和未经授权的私密图像泛滥成灾，这一安全底线对AI公司而言尤为重要。

Q&A

Q1：ChatGPT Images 2主要适合哪些用户使用？

A：ChatGPT Images 2主要面向需要快速生成专业视觉内容的职场用户，例如教师可用它制作学习指南和图文教案，营销经理可用它生成社交媒体帖子和视觉素材。它定位于Midjourney艺术创作爱好者和Adobe专业设计师之间的群体，适合那些需要制作有吸引力内容但不具备专业设计能力的普通用户。

Q2：ChatGPT Images 2在文字生成方面有哪些改进？

A：ChatGPT Images 2是OpenAI迄今在文字生成方面表现最佳的图像模型，支持多语言文字生成，并显著改善了排版、图标设计和整体构图质量。AI图像模型长期以来在生成清晰、准确的文字方面存在明显短板，ChatGPT Images 2在这一问题上取得了重要突破，能够生成更清晰、更准确的文本内容。

Q3：ChatGPT Images 2如何保障生成内容的安全性？

A：ChatGPT Images 2沿用了OpenAI此前的安全机制，通过C2PA标准在所有AI生成图像中嵌入元数据，使图像来源可被识别和追溯。此外，滥用性和违法图像在OpenAI使用政策中仍属明令禁止内容，这对于防范AI深度伪造和未经授权的私密图像传播具有重要意义。

来源：cnet

0赞

好文章，需要你的鼓励

ChatGPT Images 2发布：OpenAI关闭Sora后为何重返图像领域

来源：cnet

2026

04/22

17:11

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

扩展智能体AI需要夯实数据基础，先做好这四步

地热能源与储能技术：数据中心可靠供电的新前沿

社会科学亟需21世纪的新型研究工具与数据支撑

Moonshot AI发布Kimi K2.6：千级智能体协作处理复杂任务

Bond：借助AI帮你戒掉无休止刷屏瘾的新型社交平台

Extra：前Pinterest团队重新设计的邮件应用，真的好用

如何不依赖AI检测工具，自己识别AI生成内容

Anthropic获亚马逊50亿美元追加投资，将用于购买亚马逊AI芯片

ChatGPT图像2.0上线：具备联网搜索与多图生成能力

从AI到iPhone创新：苹果新任CEO约翰·特纳斯面临的挑战

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会