本周 ChatGPT 获得了新的艺术创作升级。母公司 OpenAI 于周三宣布,将 AI 图像生成功能直接整合到其旗舰聊天机器人中。这项功能显然非常受 ChatGPT 用户欢迎,以至于 CEO Sam Altman 在社交媒体上表示公司的 "GPU 都要融化了"。
Sam Altman (@sama) 在 2025 年 3 月 27 日发推文说:"看到人们喜欢在 ChatGPT 中生成图像真是太有趣了。但我们的 GPU 都要融化了。我们将暂时引入一些速率限制,同时努力提高效率。希望这个限制不会持续太久!ChatGPT 免费版用户很快将被限制为每天 3 次生成。"
OpenAI 的 GPU 和服务器可能并没有真的融化,但在需求增加的情况下,确实会消耗更多能源 (并产生更多热量) 并降低请求处理速度。Altman 表示,为了管理激增的请求量,公司将"在努力提高效率的同时"实施临时速率限制。这对图像生成来说并不罕见——通常升级到付费计划可以获得更多保证的快速生成次数。这有点像在迪士尼乐园购买快速通行证可以跳过长队。当 ChatGPT 的图像生成工具昨天推出时,还没有这些不同的通道。
在 ChatGPT 新的图像生成器推出的短短几小时内,一个趋势已经出现:人们正在使用它来制作吉卜力工作室风格的图像。如果你不熟悉:吉卜力的电影如《龙猫》和《悬崖上的金鱼姬》都有标志性的艺术风格。Altman 甚至将他在 X 平台上的头像换成了吉卜力风格的自己。但是创作者和 AI 公司之间的紧张关系持续升温。科技作家 Brian Merchant 在《机器中的血液》一文中指出,OpenAI 倾向于这种风格是一个值得深思的选择,特别是考虑到吉卜力工作室创始人宫崎骏曾说过 AI 工具是"对生命本身的侮辱"。
Dall-E vs ChatGPT
过去,如果人们想要使用 ChatGPT 创建图像,他们必须使用 Dall-E。Dall-E 是一个独立的程序,你可以搜索并使用它。它是我们评选的最佳 AI 图像生成器,部分原因是其独特的对话式风格使创建和编辑图像变得容易。Dall-E 仍然可以使用,而且幸运的是,ChatGPT 版本也包含了那种"对话式编辑"功能。
无论你使用什么计划,都可以使用 Dall-E 或 ChatGPT。ChatGPT 提供免费版本,付费计划起价为每月 20 美元,提供更多功能。如果你使用 ChatGPT,你当前计划的限制将适用于图像生成——如果你使用免费计划,在使用 4o 模型进行消息发送、文件上传和数据分析时可能会遇到限制。Altman 发推文说,免费用户很快将被限制为每天 3 次生成,但没有具体说明时间。
使用 ChatGPT 的图像生成
ChatGPT 4o 的图像生成将更专注于创建工作相关的图像,如信息图表和图表。OpenAI 表示已经改进了文本渲染以实现这一目标——这是非常必要的,因为 AI 经常会产生幻觉并在图像中弄错文字。你还可以上传自己的图像并使用 AI 进行编辑。
ChatGPT 的功能存在一些严重的限制。最重要的是,它表示你可能无法精确编辑图像的特定区域——这是一个重要任务,因为 AI 模型可能会产生幻觉,比如画出十一根手指的手。如果你上传自己的图像并对主体的面部进行编辑,这些更改可能会在编辑之间丢失。你可能还会遇到裁剪问题,以及在数据可视化和多语言文本方面的困难。该公司在博客文章中表示,正在努力改进这些问题,希望最早在下周推出修复方案。
与 Dall-E 一样,在 ChatGPT 中制作的图像没有任何可见的水印表明它们是 AI 生成的。OpenAI 表示,其图像将包含 C2PA 元数据,这是一个行业标准,可以让人们在幕后知道图像是由 AI 制作的。在安全性方面,OpenAI 表示将遵循与 4o 模型其他部分相同的内容准则。它表示对裸露和暴力图像有"更严格的限制"。
如何使用 ChatGPT 创建图像
现在借助 AI 实现你的艺术愿景比以往更容易。如果你想尝试 ChatGPT 的新图像生成器,以下是访问新功能的几种方法:
1. 在主页上,点击搜索和深度研究旁边的三个点。点击"创建图像"。 2. 要进行编辑,只需在聊天栏中输入你的请求并发送。 3. 当你准备使用图像时,点击右上角的向下箭头下载文件。
在我最初的简短测试中,我发现如果你提供一个参考源(如原始资料的 URL),它更可能使用正确的信息。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。