YouTube 刚刚为创作者推出了一系列基于生成式 AI 的新视频制作功能。该平台宣布,Google 的 Veo 2 视频模型将被整合到 YouTube 的实验性功能 Dream Screen 中,同时允许用户生成独立的视频片段,并将其添加到 Shorts 中。
Dream Screen 于 2023 年 9 月首次亮相,当时就已经能够根据文字描述为 Shorts 内容生成图像和视频。不过在此之前,这些生成内容只能作为虚拟绿幕背景使用。
要使用视频片段生成功能,Dream Screen 用户需要打开 Shorts 相机,进入媒体选择器,然后点击顶部的"创建"选项。随后,用户可以输入描述所需内容的文字提示,并选择期望的风格、镜头、电影效果和视频长度。
以下是展示如何使用新的视频片段生成功能的快速演示。
GIF: YouTube
根据 YouTube 的说法,该功能从今天开始在美国、加拿大、澳大利亚和新西兰全面推出,并"计划在未来向更多用户开放"。
考虑到 Google 最新的 Veo 模型仍处于早期访问阶段,且公众只能通过等候名单使用,这次更新显得格外有趣。YouTube 表示,通过整合 Veo 2,Dream Screen 能够更快地生成视频,并在真实世界物理效果和人物动作方面呈现出更加"细致和真实"的效果。生成的视频片段将同时带有视觉标签和 Google 的不可见 SynthID 水印,以标识其是由 AI 创建或修改的内容。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。