OpenAI 首席执行官 Sam Altman 于 3 月 31 日在 X 平台上宣布,ChatGPT 4 的图像生成功能现已"向所有免费用户开放!"
最近,由于用户们大量使用该功能生成吉卜力工作室风格的动画图像,这个图像生成器引起了广泛关注。3 月 27 日,面对用户们争相使用图像生成工具的情况,Altman 在帖子中表示其服务器"快要融化了"。
Altman 当时表示,图像生成功能将免费提供,但免费用户每天限制生成三张图片。订阅标准版 (每月 20 美元) 或专业版 (每月 200 美元) 的用户则不受此限制。
我测试了这个工具来创建本文的主图。尽管 ChatGPT 应用程序一度出现连接中断,但最终在不到五分钟内生成了一张 ChatGPT 飞越纽约的图像。
AI 竞争日趋激烈
OpenAI 通过开放图像生成器扩大 ChatGPT 用户群的举措,标志着 AI 技术公司之间竞争的最新篇章。除了美国、中国和其他国家的众多创业公司外,还有 Apple、Anthropic、Microsoft 以及刚在一周前推出最新 AI 模型 Gemini 2.5 的 Google。据估计,ChatGPT 每周活跃用户约 5 亿,但其他 AI 模型也在迅速发展。
除了提升处理任务和解决问题的能力外,AI 模型越来越多地被要求创建图像和视频等内容。ChatGPT 还有一个名为 Sora 的视频创作功能,但目前仅向付费用户开放。
AI 怀疑者转变为用户
经济学博士、AI 顾问和《包容方程式》作者 Serena Huang 表示,她最近也在社交媒体上看到大量吉卜力风格的图像,并一直在思考像 OpenAI 这样的图像生成器广泛使用所带来的影响。
她向 CNET 表示:"AI 图像生成是提高生产力和创新的强大催化剂。它可以加快内容创作过程,实现营销材料的快速开发,并可能促进更具吸引力的沟通。总的来说,AI 的趣味性也有助于其推广,能够让许多 AI 怀疑者在一夜之间转变为用户。"
不过,Huang 指出,人们应该关注 AI 生成内容的版权复杂性、执行 AI 任务所需的能源消耗,以及图像生成可能对创意产业造成的影响,包括就业岗位流失。
Huang 预计,其他提供基础图像创作功能的公司,如 Microsoft Copilot,可能会提升其服务水平。她说:"随着用户争夺战的加剧,我预计将会出现重大进展。"
好文章,需要你的鼓励
谷歌宣布为Chrome iOS版推出新功能,用户可在工作和个人谷歌账户间轻松切换,无需反复登录登出。该功能支持托管账户浏览,实现严格的数据分离,工作账户的标签页、历史记录和密码等本地数据与个人浏览完全隔离。随着企业不再提供公司手机,员工常需在个人设备上访问公司资源,此更新有助企业允许员工使用自选设备。
复旦大学研究团队开发的AnyI2V系统实现了从任意条件图像到视频的生成突破。该系统无需训练即可处理多种输入模态(包括3D网格、点云等),支持用户自定义运动轨迹控制,并通过创新的特征注入和语义掩模技术实现了高质量视频生成,为视频创作领域带来了革命性的便利工具。
OpenAI宣布其最新实验性推理大语言模型在2025年国际数学奥林匹克竞赛中达到金牌水平。尽管机器在数学推理、代码生成等认知任务上表现卓越,但这并不意味着它们具备真正的智能。机器缺乏知识迁移能力、情感理解、自我意识、内在动机等关键特征。它们无法像人类那样灵活适应新环境,也不具备主观体验和意识。真正的智能需要多方面综合能力,而非仅仅在特定任务上的优异表现。
斯坦福大学研究团队开发了KL-tracing方法,能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记,利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中,相比传统方法性能提升16.6%,展现了大型生成模型在计算机视觉任务中的潜力。