YouTube 刚刚为创作者推出了一系列基于生成式 AI 的新视频制作功能。该平台宣布,Google 的 Veo 2 视频模型将被整合到 YouTube 的实验性功能 Dream Screen 中,同时允许用户生成独立的视频片段,并将其添加到 Shorts 中。
Dream Screen 于 2023 年 9 月首次亮相,当时就已经能够根据文字描述为 Shorts 内容生成图像和视频。不过在此之前,这些生成内容只能作为虚拟绿幕背景使用。
要使用视频片段生成功能,Dream Screen 用户需要打开 Shorts 相机,进入媒体选择器,然后点击顶部的"创建"选项。随后,用户可以输入描述所需内容的文字提示,并选择期望的风格、镜头、电影效果和视频长度。
以下是展示如何使用新的视频片段生成功能的快速演示。
GIF: YouTube
根据 YouTube 的说法,该功能从今天开始在美国、加拿大、澳大利亚和新西兰全面推出,并"计划在未来向更多用户开放"。
考虑到 Google 最新的 Veo 模型仍处于早期访问阶段,且公众只能通过等候名单使用,这次更新显得格外有趣。YouTube 表示,通过整合 Veo 2,Dream Screen 能够更快地生成视频,并在真实世界物理效果和人物动作方面呈现出更加"细致和真实"的效果。生成的视频片段将同时带有视觉标签和 Google 的不可见 SynthID 水印,以标识其是由 AI 创建或修改的内容。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。