OpenAI 首席执行官 Sam Altman 于 3 月 31 日在 X 平台上宣布,ChatGPT 4 的图像生成功能现已"向所有免费用户开放!"
最近,由于用户们大量使用该功能生成吉卜力工作室风格的动画图像,这个图像生成器引起了广泛关注。3 月 27 日,面对用户们争相使用图像生成工具的情况,Altman 在帖子中表示其服务器"快要融化了"。
Altman 当时表示,图像生成功能将免费提供,但免费用户每天限制生成三张图片。订阅标准版 (每月 20 美元) 或专业版 (每月 200 美元) 的用户则不受此限制。
我测试了这个工具来创建本文的主图。尽管 ChatGPT 应用程序一度出现连接中断,但最终在不到五分钟内生成了一张 ChatGPT 飞越纽约的图像。
AI 竞争日趋激烈
OpenAI 通过开放图像生成器扩大 ChatGPT 用户群的举措,标志着 AI 技术公司之间竞争的最新篇章。除了美国、中国和其他国家的众多创业公司外,还有 Apple、Anthropic、Microsoft 以及刚在一周前推出最新 AI 模型 Gemini 2.5 的 Google。据估计,ChatGPT 每周活跃用户约 5 亿,但其他 AI 模型也在迅速发展。
除了提升处理任务和解决问题的能力外,AI 模型越来越多地被要求创建图像和视频等内容。ChatGPT 还有一个名为 Sora 的视频创作功能,但目前仅向付费用户开放。
AI 怀疑者转变为用户
经济学博士、AI 顾问和《包容方程式》作者 Serena Huang 表示,她最近也在社交媒体上看到大量吉卜力风格的图像,并一直在思考像 OpenAI 这样的图像生成器广泛使用所带来的影响。
她向 CNET 表示:"AI 图像生成是提高生产力和创新的强大催化剂。它可以加快内容创作过程,实现营销材料的快速开发,并可能促进更具吸引力的沟通。总的来说,AI 的趣味性也有助于其推广,能够让许多 AI 怀疑者在一夜之间转变为用户。"
不过,Huang 指出,人们应该关注 AI 生成内容的版权复杂性、执行 AI 任务所需的能源消耗,以及图像生成可能对创意产业造成的影响,包括就业岗位流失。
Huang 预计,其他提供基础图像创作功能的公司,如 Microsoft Copilot,可能会提升其服务水平。她说:"随着用户争夺战的加剧,我预计将会出现重大进展。"
好文章,需要你的鼓励
谷歌CEO皮查伊在AI竞赛低谷期坚持"信号降噪"原则,顶住压力加倍投入,最终带领谷歌凭借Gemini系列重夺领先。他坚信AI将超越火与电的革命性影响,通过递归自我改进极大降低创意实现门槛,这场"创造力民主化"浪潮或将解锁80亿人的认知潜能。
浙江大学和吉利汽车研究院联合团队提出的FreeTimeGS是一种创新的动态3D场景重建方法。不同于传统方法,它允许高斯基元在任意时空位置自由出现,并赋予每个基元运动功能,使其能够随时间移动到相邻区域。研究通过4D正则化策略解决了高不透明度基元阻碍优化的问题。在多个数据集测试中,该方法在渲染质量和速度上均大幅超越现有技术,特别是在处理复杂动态场景时,使用单个RTX 4090 GPU能以467 FPS的速度实现1080p实时渲染,为电影制作、游戏和虚拟现实等应用提供了新可能。
李飞飞的World Labs以"空间智能"重新定义AI,专注3D物理世界理解,4个月估值飙至10亿美元,获科技巨头集体押注。她揭示语言无法编码物理世界,而DNA双螺旋等突破性发现都源于三维空间的深度认知。
这篇研究介绍了"对角线批处理"技术,该技术解决了循环记忆Transformer模型在处理长文本时的并行计算瓶颈。通过重新编排计算顺序,研究团队实现了在不破坏依赖关系的情况下进行并行计算,使LLaMA-1B模型处理长文本的速度提升3.3倍,同时内存使用减少167.1倍。这种纯运行时优化不需要重新训练模型,为实际应用中的长文本处理提供了高效解决方案。