OpenAI 公司领导在周五的 Discord 办公时间会议中表示,该公司计划最终将其 AI 视频生成工具 Sora 直接整合到其广受欢迎的消费级聊天机器人应用 ChatGPT 中。
目前,Sora 只能通过 OpenAI 在去年 12 月推出的专用网页应用访问,用户可以使用同名的 AI 视频模型生成最长 20 秒的电影级片段。然而,OpenAI 的 Sora 产品负责人 Rohan Sahai 表示,公司计划将 Sora 部署到更多平台,并扩展其创作能力。
OpenAI 在去年 12 月发布之前的几个月里,主要面向创意人员和视频制作工作室推广 Sora。现在,公司正在更加积极地努力扩大其 AI 视频创作工具的受众群。
Sahai 表示,OpenAI 正在积极开发将 Sora 整合到 ChatGPT 中的方案,实现两个产品的融合,但他没有透露具体时间表。他暗示,最终整合到 ChatGPT 中的 Sora 版本可能不会提供与 Sora 网页应用相同程度的控制功能,比如用户编辑和拼接视频的能力。
OpenAI 可能试图通过让用户在聊天机器人中生成 Sora 视频来吸引更多用户使用 ChatGPT。将 Sora 整合到 ChatGPT 中还可能激励用户升级到 ChatGPT 的高级订阅层级,这些订阅可能提供更高的视频生成限制。
Sahai 在办公时间会议中解释说,OpenAI 将 Sora 作为独立网页应用推出的原因之一是为了保持 ChatGPT 的简洁性。
自推出以来,OpenAI 已经扩展了 Sora 的网页体验,为用户提供了更多浏览社区 Sora 生成视频的方式。Sahai 还表示,OpenAI "很想开发" 一个独立的 Sora 移动应用,并提到 Sora 团队正在积极招聘移动端工程师。
OpenAI 还计划将 Sora 的生成能力扩展到图像领域。
Sahai 证实了相关传闻,表示 OpenAI 正在开发一个由 Sora 驱动的 AI 图像生成器。虽然 ChatGPT 已经支持由 OpenAI 的 DALL-E 3 模型驱动的图像生成功能,但 Sora 驱动的图像生成器可能能够让用户创建更加逼真的照片。
Sahai 补充说,OpenAI 还在开发新版本的 Sora Turbo,这是目前驱动 Sora 网页应用的模型。
好文章,需要你的鼓励
SAP S/4HANA内存ERP系统推出十多年后,95%的传统用户表示构建积极的迁移案例需要巨大努力或面临真正挑战。一项涵盖455名CIO、高级IT角色、SAP专家和业务经理的调查发现,83%的受访者不完全理解SAP最新的迁移政策和截止日期,84%对当前信息传递及其对运营的影响表示担忧。SAP为传统ECC系统设定了激进的支持截止日期,主流支持将于2027年结束。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
微软通过其Planetary Computer平台将NASA的Landsat和Sentinel-2卫星数据集引入Azure云服务。该数据集包含来自NASA的Landsat 8、9号卫星以及欧洲航天局Sentinel-2系列卫星的地球监测数据,为气候变化、土地利用、农业应用等研究提供宝贵资源。用户可通过API或Azure存储直接访问这些PB级全球环境数据。微软还建议研究人员使用Azure OpenAI服务创建智能应用,结合AI技术进行土地分类、植被监测、森林砍伐趋势分析等地球观测研究。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。