OpenAI 首席执行官 Sam Altman 于 3 月 31 日在 X 平台上宣布,ChatGPT 4 的图像生成功能现已"向所有免费用户开放!"
最近,由于用户们大量使用该功能生成吉卜力工作室风格的动画图像,这个图像生成器引起了广泛关注。3 月 27 日,面对用户们争相使用图像生成工具的情况,Altman 在帖子中表示其服务器"快要融化了"。
Altman 当时表示,图像生成功能将免费提供,但免费用户每天限制生成三张图片。订阅标准版 (每月 20 美元) 或专业版 (每月 200 美元) 的用户则不受此限制。
我测试了这个工具来创建本文的主图。尽管 ChatGPT 应用程序一度出现连接中断,但最终在不到五分钟内生成了一张 ChatGPT 飞越纽约的图像。
AI 竞争日趋激烈
OpenAI 通过开放图像生成器扩大 ChatGPT 用户群的举措,标志着 AI 技术公司之间竞争的最新篇章。除了美国、中国和其他国家的众多创业公司外,还有 Apple、Anthropic、Microsoft 以及刚在一周前推出最新 AI 模型 Gemini 2.5 的 Google。据估计,ChatGPT 每周活跃用户约 5 亿,但其他 AI 模型也在迅速发展。
除了提升处理任务和解决问题的能力外,AI 模型越来越多地被要求创建图像和视频等内容。ChatGPT 还有一个名为 Sora 的视频创作功能,但目前仅向付费用户开放。
AI 怀疑者转变为用户
经济学博士、AI 顾问和《包容方程式》作者 Serena Huang 表示,她最近也在社交媒体上看到大量吉卜力风格的图像,并一直在思考像 OpenAI 这样的图像生成器广泛使用所带来的影响。
她向 CNET 表示:"AI 图像生成是提高生产力和创新的强大催化剂。它可以加快内容创作过程,实现营销材料的快速开发,并可能促进更具吸引力的沟通。总的来说,AI 的趣味性也有助于其推广,能够让许多 AI 怀疑者在一夜之间转变为用户。"
不过,Huang 指出,人们应该关注 AI 生成内容的版权复杂性、执行 AI 任务所需的能源消耗,以及图像生成可能对创意产业造成的影响,包括就业岗位流失。
Huang 预计,其他提供基础图像创作功能的公司,如 Microsoft Copilot,可能会提升其服务水平。她说:"随着用户争夺战的加剧,我预计将会出现重大进展。"
好文章,需要你的鼓励
尽管AI实验广泛开展,但大多数AI项目缺乏成熟度无法规模化。93%的组织在使用或构建AI系统,但仅不到10%建立了强健的治理框架。研究显示,超过50%的AI实验从未投产,仅1%的项目实现真正变革性成果。缺乏数据和AI主权是关键障碍,而拥有主权的组织AI项目成功率提升2倍,回报率增长5倍。
香港中文大学等顶尖院校联合研究发现,当前最先进的AI视频生成技术已能制作出连顶级检测系统都无法识别的假视频。研究团队开发了Video Reality Test平台,测试结果显示最强生成模型Veo3.1-Fast的假视频仅有12.54%被识别,而最强检测系统Gemini 2.5-Pro准确率仅56%,远低于人类专家的81.25%。研究还发现检测系统过度依赖水印等表面特征,音频信息能提升检测准确性,但技术发展已对信息真实性判断带来严峻挑战。
企业正竞相释放AI的变革潜力,但真正的瓶颈不在技术而在人力准备度。Gartner研究显示,56%的CEO计划在未来五年削减管理层级,但91%的CIO未跟踪AI引发的技能变化。超过80%的领导者根本不衡量AI准确性。AI价值取决于员工适应和与智能机器共同发展的能力。CIO必须应对五个关键人力障碍:AI退出效应、中层管理困境、行为副产品、准确性悖论和影子AI现象,这些深层次的行为反射和组织动态如不解决将阻碍转型。
Google DeepMind团队提出了革命性的"扩散预览"模式,通过ConsistencySolver技术实现AI图像生成的"预览+精修"工作流程。该技术能在5-10步内生成高质量预览图像,与传统40步完整生成保持高度一致性,用户体验测试显示总体时间节省近50%,大大提高了创作效率和创意探索的自由度。