OpenAI 首席执行官 Sam Altman 于 3 月 31 日在 X 平台上宣布,ChatGPT 4 的图像生成功能现已"向所有免费用户开放!"
最近,由于用户们大量使用该功能生成吉卜力工作室风格的动画图像,这个图像生成器引起了广泛关注。3 月 27 日,面对用户们争相使用图像生成工具的情况,Altman 在帖子中表示其服务器"快要融化了"。
Altman 当时表示,图像生成功能将免费提供,但免费用户每天限制生成三张图片。订阅标准版 (每月 20 美元) 或专业版 (每月 200 美元) 的用户则不受此限制。
我测试了这个工具来创建本文的主图。尽管 ChatGPT 应用程序一度出现连接中断,但最终在不到五分钟内生成了一张 ChatGPT 飞越纽约的图像。
AI 竞争日趋激烈
OpenAI 通过开放图像生成器扩大 ChatGPT 用户群的举措,标志着 AI 技术公司之间竞争的最新篇章。除了美国、中国和其他国家的众多创业公司外,还有 Apple、Anthropic、Microsoft 以及刚在一周前推出最新 AI 模型 Gemini 2.5 的 Google。据估计,ChatGPT 每周活跃用户约 5 亿,但其他 AI 模型也在迅速发展。
除了提升处理任务和解决问题的能力外,AI 模型越来越多地被要求创建图像和视频等内容。ChatGPT 还有一个名为 Sora 的视频创作功能,但目前仅向付费用户开放。
AI 怀疑者转变为用户
经济学博士、AI 顾问和《包容方程式》作者 Serena Huang 表示,她最近也在社交媒体上看到大量吉卜力风格的图像,并一直在思考像 OpenAI 这样的图像生成器广泛使用所带来的影响。
她向 CNET 表示:"AI 图像生成是提高生产力和创新的强大催化剂。它可以加快内容创作过程,实现营销材料的快速开发,并可能促进更具吸引力的沟通。总的来说,AI 的趣味性也有助于其推广,能够让许多 AI 怀疑者在一夜之间转变为用户。"
不过,Huang 指出,人们应该关注 AI 生成内容的版权复杂性、执行 AI 任务所需的能源消耗,以及图像生成可能对创意产业造成的影响,包括就业岗位流失。
Huang 预计,其他提供基础图像创作功能的公司,如 Microsoft Copilot,可能会提升其服务水平。她说:"随着用户争夺战的加剧,我预计将会出现重大进展。"
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。