OpenAI 公司领导在周五的 Discord 办公时间会议中表示,该公司计划最终将其 AI 视频生成工具 Sora 直接整合到其广受欢迎的消费级聊天机器人应用 ChatGPT 中。
目前,Sora 只能通过 OpenAI 在去年 12 月推出的专用网页应用访问,用户可以使用同名的 AI 视频模型生成最长 20 秒的电影级片段。然而,OpenAI 的 Sora 产品负责人 Rohan Sahai 表示,公司计划将 Sora 部署到更多平台,并扩展其创作能力。
OpenAI 在去年 12 月发布之前的几个月里,主要面向创意人员和视频制作工作室推广 Sora。现在,公司正在更加积极地努力扩大其 AI 视频创作工具的受众群。
Sahai 表示,OpenAI 正在积极开发将 Sora 整合到 ChatGPT 中的方案,实现两个产品的融合,但他没有透露具体时间表。他暗示,最终整合到 ChatGPT 中的 Sora 版本可能不会提供与 Sora 网页应用相同程度的控制功能,比如用户编辑和拼接视频的能力。
OpenAI 可能试图通过让用户在聊天机器人中生成 Sora 视频来吸引更多用户使用 ChatGPT。将 Sora 整合到 ChatGPT 中还可能激励用户升级到 ChatGPT 的高级订阅层级,这些订阅可能提供更高的视频生成限制。
Sahai 在办公时间会议中解释说,OpenAI 将 Sora 作为独立网页应用推出的原因之一是为了保持 ChatGPT 的简洁性。
自推出以来,OpenAI 已经扩展了 Sora 的网页体验,为用户提供了更多浏览社区 Sora 生成视频的方式。Sahai 还表示,OpenAI "很想开发" 一个独立的 Sora 移动应用,并提到 Sora 团队正在积极招聘移动端工程师。
OpenAI 还计划将 Sora 的生成能力扩展到图像领域。
Sahai 证实了相关传闻,表示 OpenAI 正在开发一个由 Sora 驱动的 AI 图像生成器。虽然 ChatGPT 已经支持由 OpenAI 的 DALL-E 3 模型驱动的图像生成功能,但 Sora 驱动的图像生成器可能能够让用户创建更加逼真的照片。
Sahai 补充说,OpenAI 还在开发新版本的 Sora Turbo,这是目前驱动 Sora 网页应用的模型。
好文章,需要你的鼓励
随着数字化时代的到来,网络安全威胁呈指数级增长。勒索软件、AI驱动的网络攻击和物联网设备漏洞成为主要威胁。企业需要建立全面的风险管理策略,包括风险评估、安全措施实施和持续监控。新兴技术如人工智能、区块链和量子计算为网络安全带来新机遇。组织应重视员工培训、供应链安全、数据治理和事件响应能力建设。
滑铁卢大学研究团队开发出ScholarCopilot,一个革命性的AI学术写作助手。该系统突破传统"先检索后生成"模式,实现写作过程中的动态文献检索和精确引用。基于50万篇arXiv论文训练,引用准确率达40.1%,大幅超越现有方法。在人类专家评估中,引用质量获100%好评,整体表现优于ChatGPT。这项创新为AI辅助学术写作开辟新道路。
AWS Amazon Bedrock负责人Atul Deo正致力于让人工智能软件变得更便宜和更智能。他在12月re:Invent大会前只有六个月时间来证明这一目标的可行性。Deo表示AI领域发展速度前所未有,模型每几周就会改进,但客户只有在经济效益合理时才会部署。为此,AWS推出了提示缓存、智能路由、批处理模式等功能来降低推理成本,同时开发能执行多步骤任务的自主代理软件,将AI应用从聊天机器人转向实际业务流程自动化。
哥伦比亚大学研究团队发布NodeRAG技术,通过异构图结构革新智能问答系统。该方法将文档信息分解为7种节点类型,采用双重搜索机制,在多个权威测试中准确率达89.5%,检索效率提升50%以上,为智能信息检索技术带来重大突破。